Meta人工智能“外交”玩赢人类 “AI乌托邦”离现实有多远?

撰文: 叶德豪
出版:更新:

随着近年深度学习的人工智能(AI)兴起,人们对于另一个“乌托邦”的到来又有了一番期许——当AI可能取代人类大部分工作、全球生产力急速上升,人们就可以不用上班、永远放假,并透过政府向企业征收的“AI税”大派福利过活。11月22日,前身名为“Facebook”的Meta在《科学》(Science)期刊公布其“西塞罗”(Cicero)AI在“外交”(Diplomacy)游戏中的惊人成绩,被视为AI发展的另一个里程碑。

在各种游戏中击败人类,过去数十年也是AI进展的象征。1997年,IBM的超级电脑“深蓝”(Deep Blue)击败了西洋象棋世界冠军卡斯帕罗夫(Garry Kasparov),震动世界,也完全改变了今天人类象棋比赛的样态。2016年,Google母公司Alphabet旗下DeepMind的AlphaGo在围棋上击败韩国棋王李世乭,也间接促成了后者在2019年的退役决定。

然而,相比起象棋又或者围棋,甚至是星际争霸(StarCraft)的游戏,“外交”对于AI而言是一个根本上不一样的难题。“外交”是一种发明于1954年的策略游戏,游戏将欧洲分成75个省,玩家可建立和动员军队占领省份,直至有人控制大多数所谓的“供应中心”为止。游戏的特点是玩家与玩家之间必须以一对一的“私下沟通”尝试联合行动、建立同盟又或者欺骗对方等等。经过沟通过后,每一位玩家都写下自己在一个回合内的行动,然后同时公开执行。

这套游戏要求AI能够以人类的自然语言与其他人类沟通,并且将自己计划中的行动以人类语言让他人明白、从他人的语言中理解到他们计划中的行动。而且,由于欺骗等人类沟通特征的存在,这一套AI还要能够从对手的言语中猜测到对方是在讲真话还是在讲假话、懂得不要向对手透露自己的真正意图等等。这大概需要AI去模拟出一套“心智理论”,可以从别人过去的行动、别人的沟通、别人对自己行动的预测等等去推测出别人到底会作出什么决定。

西塞罗(CICERO)与人类玩家的谈判例子。(Meta论文原图*)

由于上述这些特征,“外交”游戏远较象棋和围棋复杂,在AI的训练上面也更为麻烦——围棋之类有明显规则,AI的训练可透过自我模拟棋局演练而进行。

但最终,Meta的“西塞罗”AI在网络版的“外交游戏”中却有惊人成绩:在40场游戏中,西塞罗在所有玩过一场游戏以上的玩家中排名前10%,其得分中为数为25.8%,是其82个对手所得的平均数的两倍;而在有21个玩家参与的8场联赛中,西塞罗更排名第一。在整个试验之中,没有任何人类玩家在赛内沟通中发现西塞罗不是人类而是AI,而只有一位玩家在赛后沟通中曾质疑西塞罗可能是个程式机械人。

Meta在其博客文章中就表示,西塞罗是建立能与人谈判、说服别人且与人类合作的AI的一个突破。我们可以想像,如果西塞罗能进一步完善,并运用在不同的领域之中,很多不同行业也能被AI取代,从宽频网络的客户服务员到律师也是如此。虽然行业被取代看起来是一个悲观的未来,但配合起我们“乌托邦”想像中的政府财富再分配政策,这不失为乌托邦科技基础中的必要一环。

不过,根据美国人工智能学者和作家Gary Marcus的分析,在“外交”游戏的具体表现之上,西塞罗确实惊人,在一个动态世界的语言和行动整合中达至广度和广度都前所未见的整合,而且能够与人类进行前所未见的复杂互动。但类似西塞罗的AI真的能轻易扩展到其他范畴之上吗?

Marcus对此提出了两点疑虑。首先,西塞罗的的模型结构非常复杂,也全为玩好“外交”这个游戏而设,很大可能不能简单复制到其他领域的用途上面。

西塞罗AI模式的大体结构,其具体细节还比此图例复杂。(Meta论文原图*)

其次,由于“外交”游戏远较围棋等繁琐,并不能透过电脑自行模拟赛局作训练,用于其训练的据数往往需要人类的介入,成本极高。为了训练西塞罗,Meta团队收集了“外交”游戏网站中的12.53万场人类玩过的比赛记录,当中还包括4.04万组对话,当中总共和1,290万条个别讯息;而且为免西塞罗在谈判时发出没有意义、劣质或没有战略价值的资讯,西塞罗的模型中还包含了资讯过滤模型,此模型的训练数据也来自人手编制。

目前,如果是纯语句的数据,网络上是有大量供应,但类似“外交”中由游戏状态、人类沟通与人类行动互相交缠在一起的数据,却是极难获得的。这套游戏的相关数据幸好有网上游戏平台代为收集,但试问宽频客户服务部有没有类似的相应系统性数据收集?

Marcus认为,即使建立似类西塞罗这种AI背后的工作模式可用于解决其他问题,但西塞罗的具体架构对于解决其他问题大概是不适用的。而西塞罗在“外交”游戏上的成功,也间接突显出AI的局限:其复杂的先天架构,似乎显示出AI的发展不只是制造愈来愈大的模型,而且其成功也不能支持有一套能用于所有领域的单一普及程式的想像。

AI在个别领域上的成功,是不可忽视的;其在自然语言处理上的成就,更是惊人的,甚至让一些有识之士从与AI的对话中得出AI是有心灵的结论。但我们离“AI乌托邦”还非常远,而且AI的发展更未必会向着不断拉近这段距离的方向发展。

*Meta论文连结:https://www.science.org/doi/10.1126/science.ade9097