【科技.未来】人脸辨识升级 情感辨识应用遍地开花
当人脸辨识在全球各地相继推出,令人担心环形监狱时代来临,更进一步的反乌托邦或许在等着我们。一些科技公司声称可以人工智能(AI)分析我们的表情,解读出情感状态,有助各行各业了解消费者喜好之外,更可被执法机关用来判断你是否对公众安全构成威胁。不过,当人类早已熟练笑里藏刀,AI又是否真的有能力看穿我们的真正感受?
10月底,深圳举行中国国际社会安全博览会,逾1,500个参展商展出多种新科技监视器材。其中,新疆阿勒泰地区公安局治安支队队长李晓宇就向《金融时报》介绍:“利用影片录像,情绪辨识科技可借由分析精神状态迅速分辨出疑犯,预防非法行为,包括恐怖主义和走私。我们已经开始使用。”他补充,这科技主要用于海关,分辨某人有否流露紧张的迹象、其压力水平以及攻击他人的潜在可能。
李晓宇还透露,正与不同业者合作,包括海康威视、宇视科技、大华科技和天地伟业等内地知名监控公司:“只有在AI方面强大的公司才可在这领域成功,当然,这领域内最大的两家公司就是阿里巴巴和腾讯。”旷视科技一名不愿具名的代表则说,情感辨识科技已在政府内广泛开发和使用,尤其是公共安全机关。
以机器解读情感
据美国麻州理工媒体实验室情感计算科学家Javier Hernandez解释,情感AI是一种让人类与机器更自然互动的工具:“想想你与其他人类互动的方式,你看他们的脸和身体,并相应改变互动。若机器不知道你的情感状态、感受,对某种内容会有什么反应,它能够有效沟通吗?”
现时,人类在阅读情感上可能占上风,但机器正逐渐进步。麻州理工史隆管理学院教授Erik Brynjolfsson说,这是因为机器十分擅长分析大量数据:“就像我们可理解语言而机器可用言语沟通,我们也可以用幽默和其他情感来理解和沟通。能够说这种情感语言的机器,将与我们有更好、更有效的互动。很高兴我们已有点进展,这在过去二十或三十年前根本不可能,现在却摆在眼前。”
情感辨识牵涉两种技术,其一为电脑视觉(computer vision),仔细辨识面部表情;另一为机器学习演算法,分析和解读这些面部特征的情感内容。后者需要经过监督学习(supervised learning),若你向演算法展示大量标签为“开心”的开心面孔照片,当它看见一幅新的开心面孔照片就能辨识为“开心”。
现时绝大部份情感辨识技术,基本上都是想借由把脸上的表情和位置如座标般记录,从而反映出对应的内在情感。这种概念很大程度上来自于美国加州大学柏克莱分校(UC Berkeley)心理学家Paul Ekman,他在上世纪六十年代主张,愉快、伤心、厌恶、恐惧、愤怒和意外,这六种情感不论文化背景为何,都会以普同的方式展现,并可透过分析面部肌肉动作来侦测。为测试这种假设,Ekman向不同群体展示来自世界各地的面孔照片,叫他们分辨看到什么情感。研究发现,即使存在重大文化背景差异,人类仍可配对出同样的面部表情和情绪。
过去二十年,Ekman试图将他的发现发展成辨识人类表情来判断情感的方法。当某种潜在的情感在某人心中触发了,相应的面部表情就会自动出现,甚至即使想掩饰这情感,真实、本能的反应仍然会泄露在脸上,即他所谓的“微表情”(micro expression),逃不过识途老马的“法眼”。
情感辨识遍地开花
现时,一些科技巨头已在提供这种服务。微软(Microsoft)在2015年推出其情感辨识技术时,就声称其演算法可“辨识八种核心情感状态:愤怒、鄙视、恐惧、厌恶、愉快、中性、失落和诧异”。亚马逊(Amazon)在8月中宣布其人脸辨识服务Rekognition,可在本来已侦测的“快乐”、“伤心”、“愤怒”、“意外”、“厌恶”、“冷静”和“困惑”之外,加入第八种情绪“恐惧”。网站上还建议了多种用途,例如商店可把顾客的实时影像输入到这人脸分析工具,在不同零售地点追踪他们的情感和族群。
Google虽然在内部伦理评估认为会侵犯私隐的压力下,没有像亚马逊和微软般出售人脸辨识服务,但其人工智能云端服务仍会在照片中侦测和分析人类面孔,估算年龄、性别和四种情感:喜悦、忧伤、愤怒和意外。在Google照片应用程式中搜寻“喜悦”、“愤怒”等字眼,就会得出它判断包涵这些表情在内的照片。
辨识消费者或潜在顾客的反应,是情感辨识的一大商业用途。情感AI初创公司Realeyes,正是以Ekman的六种基本情感、眼球追踪和面部表情来分析观众对广告的反应。例如去年圣诞,英国高档连锁百货约翰路易斯(John Lewis)播出了《男孩与钢琴》的广告,倒述殿堂级歌手Elton John的成长故事,从天王巨星回到儿时父母买给他作为礼物的钢琴,配上他脍炙人口的《Your Song》。虽然广告播出后整体反应不错,但在Realeyes看来则没那么简单。他们请来200名观众看这广告,并且同意过程中以电脑或手机镜头录下每分每秒的反应,然后,以人工智能分析每人的面部表情和身体语言,综合注意力和情感后评分。
Realeyes发现这广告的开头就已录到正反观众情感。行政总裁Mihkel Jäätma解释:“英国观众其实对片中Elton John那部份不太兴奋,负数上升,大家早已听够了对这名人的吹捧。”而到他的小孩版出现时,则出现较多正面的情感反应:“当谈到家庭和小孩而不再是名人,好感度大增。所以,我们认为这广告的焦点在于那小孩。几乎没有Elton John的话会好很多,或者至少应缩短。”广告片长2分20秒,“实在太长,只能在电视上播,无人会在网上看。”一些大型食品商如可口可乐(Coca-Cola)、玛氏(Mars)都是Realeyes的客户,日本电信电话(NTT)亦有份投资。
类似的做法也见于电影。人脸辨识公司Kairos就与传奇影业(Legendary Pictures)合作,以这种技术在电影试映时测量观众反应。传奇影业会利用所得大量数据,决定电影中哪些剧情最适合用来制作广告片,分辨“最有可能分享电影预告的群体”,确保它的电影“同时满足主流观众和针对性的粉丝族群”。
很多其他界别也看中了情感辨识的潜力。初创公司Hirevue就声称,其程式可帮助雇主分析应征者面试录影,判断其性格和表现,剔除不合格的应征者,增加招聘效率。达美航空(Delta)、冬甩专门店Dunkin' Donuts、服饰及生活杂货品牌Urban Outfitters、联合利华(Unilever)等知名巨企都是其客户。
另一情感AI业者Affectiva就推出了专用于汽车的情感辨识功能,声称可结合人脸和语言分析测度驾驶者的情绪,确保行车安全;也能辨识乘客的舒适度和睡意来调适车内环境如光线和暖气,又或在辨识到乘客紧张或不适时,可改变汽车自动驾驶的风格。杭州第十一中学去年则设置了“智慧课堂行为管理系统”,声称可以镜头捕捉七种情绪,包括高兴、难过、愤怒、反感、惊讶、害怕和中性,从而判断学生上课是否专心,并在学生“云游”时知会老师。
使用这技术执法的当然不限于中国,拉脱维亚、匈牙利和希腊就测试过一套名为iBorderCtrl的出入境“测谎”系统,旅客要预先在其网站口头回答虚拟关员的查问,系统透过镜头观察他的微表情,再在入境时由职员核对指纹、容貌、护照等,得出一个以100为满分的分数,让关员参考旅客是否可信。
英国公司WeSee行政总裁David Fulton对《英国广播公司》(BBC)声称:“即使使用低画质的影像,我们的技术也有能力从一个人的面部表情、姿势、动作,判断他的精神状态。在未来,地铁月台的监视器可使用我们的科技来侦测可疑行为,并就潜在恐怖袭击向当局发出警报。同样也可用于多人聚集的活动如足球比赛或政治集会。”他并补充,“大约有60%至70%准确率。”
而向美国联邦调查局(FBI)销售撷取手机数据软件的Oxygen Forensics,本年7月在其产品中加入人脸及情绪辨识功能。营运总监Lee Reiber说,可帮助警方搜证时在成千上万的照片中分类,可从中就特定容貌搜寻,也可过滤不同种族、年龄层,以及情绪如“喜悦”和“愤怒”。Reiber承认这工具并非完美,但可助探员加快工作,又强调调查过程中,线索需要以多种方式检验:“我希望尽可能取得最多碎片,再把他们重构成完整图画。”
继续阅读︰辨识人脸表情 等于读懂“情感”?
相关文章︰
上文节录自第191期《香港01》周报(2019年12月2日)《人脸辨识升级 从表情读懂情感?》。
更多周报文章︰【01周报专页】
《香港01》周报,各大书报摊、OK便利店及Vango便利店有售。你亦可按此订阅周报,阅读更多深度报道。