【科技.未来】制法容易上手 deepfake层出不穷
今年5月,一条影片在美国的社交媒体上疯传,仅在Facebook就录得数百万人次观看,连美国总统特朗普的私人律师朱利亚尼(Rudolph W. Guliani)也急不及待在Twitter转发。影片中,正在演讲的美国众议院议长佩洛西(Nancy Pelosi)说话结巴,咬字含糊,情况引人质疑。原来这条影片经过刻意篡改。美国明年将会举行总统大选,今次事件再次敲响了假新闻可能左右选举的警号,尤其是使用人工智能(AI)、更为像真的“深度造假”(deepfake)影片日益容易制作。
朱利亚尼得悉自己转发的是假影片时这样解释:“我没有理由认为它是被修改过的。你从哪里可以知道片段是不实的?我如何可以知道它是假的?”他称自己没有看过原片,是在别人告诉他影片有问题后才删除帖文,虽然听起来像是狡辩,但并非全无道理。随着造假技术进步,假影片将会愈来愈真,愈来愈易制造,并愈来愈难分辨出影片孰真孰假。
纽约州立大学水牛城分校人工智能研究院教授David Doermann指出,deepfake和假新闻的威胁将会愈来愈大,因为制作技术愈趋普及,过往需要昂贵器材和软件制作deepfake,现时只要“一个高中生和一台不错的电脑”便可做到:“已经不再需要AI专家,新手也可以做到。”
三星(Samsung)位于俄罗斯莫斯科的AI中心在5月公布了一项新技术:其AI系统只需极少的数据,甚至只需要一张脸部照片,就可生成像真度高、可动的人像影片,若加添少许数据,例如8至32张照片,便能更进一步提高像真度。
三星以公开资料库VoxCeleb的数据训练演算法,内含逾7,000张从YouTube影片收集而来的名人影像,让演算法学会辨识眼、嘴形、鼻梁形状和长度等人面特征,继而用知名人像来制作动画。例如逝世时动画摄录器材还未面世的俄国大文豪杜斯妥也夫斯基(Fyodor Dostoyevsky),就在一条黑白影片中说话;达文西(Leonardo da Vinci)名作《蒙罗丽莎》(Mona Lisa)中的女士不只懂得微笑,还可以说话,并带有不同的眼神;艺术家达利(Salvador Dali)那标志性的胡子也会随着他说话而抽动。
史丹福大学则与普林斯顿大学、德国马克斯普朗克信息学研究所(Max Planck Institute for Informatics),以及Adobe Research合作,开发了另一套AI系统,只要改动影片逐字稿,AI就会以影片中人的声韵并配合嘴形,读出所需的对白。他们试过将电影《现代启示录》的著名对白“我喜欢清晨中凝固汽油弹的气味”改成“我喜欢清晨中西多士的气味”。
制作这种影片涉及几种技术。首先,研究人员需要扫描目标对象在整段影片中说过的所有音素(phonemes,发音的基本组成部份),接着把这些音素与他的发音嘴形配对,最后还要为目标人物的下半边脸建立立体模型。做好这些工作后,当研发人员修改影片的逐字稿,软件便会自动组合这三组数据,重建一条配合文字改动的新影片,然后贴到原有片源来得出成品。
非牟利人权组织Witness项目总监Sam Gregory主张,应该主动出击对付deepfake,而非被动等待有deepfake出现才处理:“从过往全球对假消息的反应来看,我们明显需要更好的准备,以应付这个威胁,而非像在2016年(美国总统)选举出现问题后才作出反应。即使威胁比预期中小,预先做好准备,总好过事后才作出反应。”Gregory指,全球社交媒体应该联合组成一个“共同免疫系统”,以找出和阻止假影片疯传。
相关文章:deepfake沦为政界新武器 或成美国大选隐忧?社交媒体卸责 如何打击deepfake
上文节录自第169期《香港01》周报(2019年7月2日)《威胁日增 美向Deepfake开战》。
其他Deepfakes及人工智能文章:Deepfake假得迫真 深度造假模糊真相什么才可信?防伪研发竞赛展开 单靠科技足以打击深度造假?
更多周报文章︰【01周报专页】《香港01》周报,各大书报摊、OK便利店及Vango便利店有售。你亦可按此订阅周报,阅读更多深度报道。