【科技．未来】制法容易上手　deepfake层出不穷

撰文：孔祥威

出版：2019-07-05 18:00更新：2025-02-12 11:08

今年5月，一条影片在美国的社交媒体上疯传，仅在Facebook就录得数百万人次观看，连美国总统特朗普的私人律师朱利亚尼（Rudolph W. Guliani）也急不及待在Twitter转发。影片中，正在演讲的美国众议院议长佩洛西（Nancy Pelosi）说话结巴，咬字含糊，情况引人质疑。原来这条影片经过刻意篡改。美国明年将会举行总统大选，今次事件再次敲响了假新闻可能左右选举的警号，尤其是使用人工智能（AI）、更为像真的“深度造假”（deepfake）影片日益容易制作。

朱利亚尼得悉自己转发的是假影片时这样解释：“我没有理由认为它是被修改过的。你从哪里可以知道片段是不实的？我如何可以知道它是假的？”他称自己没有看过原片，是在别人告诉他影片有问题后才删除帖文，虽然听起来像是狡辩，但并非全无道理。随着造假技术进步，假影片将会愈来愈真，愈来愈易制造，并愈来愈难分辨出影片孰真孰假。

纽约州立大学水牛城分校人工智能研究院教授David Doermann指出，deepfake和假新闻的威胁将会愈来愈大，因为制作技术愈趋普及，过往需要昂贵器材和软件制作deepfake，现时只要“一个高中生和一台不错的电脑”便可做到：“已经不再需要AI专家，新手也可以做到。”

三星（Samsung）位于俄罗斯莫斯科的AI中心在5月公布了一项新技术：其AI系统只需极少的数据，甚至只需要一张脸部照片，就可生成像真度高、可动的人像影片，若加添少许数据，例如8至32张照片，便能更进一步提高像真度。

三星以公开资料库VoxCeleb的数据训练演算法，内含逾7,000张从YouTube影片收集而来的名人影像，让演算法学会辨识眼、嘴形、鼻梁形状和长度等人面特征，继而用知名人像来制作动画。例如逝世时动画摄录器材还未面世的俄国大文豪杜斯妥也夫斯基（Fyodor Dostoyevsky），就在一条黑白影片中说话；达文西（Leonardo da Vinci）名作《蒙罗丽莎》（Mona Lisa）中的女士不只懂得微笑，还可以说话，并带有不同的眼神；艺术家达利（Salvador Dali）那标志性的胡子也会随着他说话而抽动。

史丹福大学则与普林斯顿大学、德国马克斯普朗克信息学研究所（Max Planck Institute for Informatics），以及Adobe Research合作，开发了另一套AI系统，只要改动影片逐字稿，AI就会以影片中人的声韵并配合嘴形，读出所需的对白。他们试过将电影《现代启示录》的著名对白“我喜欢清晨中凝固汽油弹的气味”改成“我喜欢清晨中西多士的气味”。

制作这种影片涉及几种技术。首先，研究人员需要扫描目标对象在整段影片中说过的所有音素（phonemes，发音的基本组成部份），接着把这些音素与他的发音嘴形配对，最后还要为目标人物的下半边脸建立立体模型。做好这些工作后，当研发人员修改影片的逐字稿，软件便会自动组合这三组数据，重建一条配合文字改动的新影片，然后贴到原有片源来得出成品。

非牟利人权组织Witness项目总监Sam Gregory主张，应该主动出击对付deepfake，而非被动等待有deepfake出现才处理：“从过往全球对假消息的反应来看，我们明显需要更好的准备，以应付这个威胁，而非像在2016年（美国总统）选举出现问题后才作出反应。即使威胁比预期中小，预先做好准备，总好过事后才作出反应。”Gregory指，全球社交媒体应该联合组成一个“共同免疫系统”，以找出和阻止假影片疯传。

上文节录自第169期《香港01》周报（2019年7月2日）《威胁日增　美向Deepfake开战》。

其他Deepfakes及人工智能文章：Deepfake假得迫真　深度造假模糊真相什么才可信？防伪研发竞赛展开　单靠科技足以打击深度造假？

更多周报文章︰【01周报专页】《香港01》周报，各大书报摊、OK便利店及Vango便利店有售。你亦可按此订阅周报，阅读更多深度报道。

【科技．未来】制法容易上手 deepfake层出不穷

【科技．未来】制法容易上手　deepfake层出不穷