自学话事啤 识吹牛抛窒对手 AI首赢人类高手成赌王

撰文: 李蔼明
出版:更新:

人工智能(AI)会驾驶、打官司、下棋,而且还懂赌博。周一(30日)在一场长达20日的得州话事啤赛事中,AI胜过四大高手,成为赌王。“啤牌属于人性游戏”,恐怕在未来我们再不能如此断言。

美国匹兹堡的Rivers Casino近日举办人机话事啤大战。(卡内基梅隆大学)

美国匹兹堡的Rivers Casino近日举办人机话事啤大战,由4名啤牌高手轮流作赛,每日对着电脑荧幕长达11小时,与名为Libratus的AI软件对战。结果4人均不是Libratus对手,AI赢得的虚拟筹码总值逾170万美元,是史上首次有AI于牌桌上胜过人类。

 研发困难 团队本无信心

卡内基梅隆大学的电脑科学教授桑德霍尔姆(Tuomas Sandholm)与学生布朗(Noam Brown)共同研发了Libratus,桑德霍尔姆表示研发相当困难且复杂,本来自己亦没信心,“国际投注网站开出的赔率是四比一,认为我们处劣势而人类会胜出。”

每日赛事长达11小时,对人类而言是情商及耐力的挑战。图为参赛者之一Dong Kim。(卡内基梅隆大学)

 遇强愈强 漏夜修正弱点

人类每日对战完会休息进食、检讨失误,而Libratus每日对战完,亦会上载牌局资料至匹兹堡超级电脑中心,漏夜演算运作,令玩啤牌的能力更加精进。其中一名高手Jimmy Chou表示Libratus每日都变得更强,难以击破:“开始数天我们甚有希望。但每次我们找到弱点,它都会从中学习,第二天该弱点就消失无存。”

 长时间作战对人类不利

长时间对战及落败,对人类而言是情商的挑战。曾与Claudico和Libratus对战的莱斯(Jason Les)表示:“Libratus比我们想像的更优秀,令人有点情绪低落。与人类对战,输掉后你可以停止并休息一下。但在这儿我们每日要对战11小时。当你不习惯如此频密地落败,这是非常不同的情绪体验。”

玩啤牌时,每人都会隐藏自己的牌,因此玩家所得资料并不完备,不利于AI运算。(网上图片)

 以大博小 与人类迥异

Libratus的风格相当激进冒险,会大量押注以博取小额彩金。莱斯表示:“一般人类不会这样做,但这会迫你每一场都保持警觉。”

 啤牌资讯不完全 难以拆解运算

啤牌向来是AI业界公认难以攻陷的范畴。桑德霍尔姆于2015年亦研发了AI啤牌玩家Claudico,并派出参与人机大战,最终惨败而回。相较棋类而言,啤牌的运算较为困难。棋盘上的变化、活动,所有玩家都一目了然;然而玩啤牌时,每个人都收起手上的牌面,资料并不完全,难以拆解运算,需要以直觉猜测对手出牌。

除了估算对手出牌外,夸大其词误导对手对话事啤而言亦非常重要。(网上图片)

Libratus不但运算能力较高,亦较擅于处理不完备资讯。布朗表示:“我们并未教导Libratus玩啤牌,只是输入了游戏规则让它自己学习。”系统自动模拟了上万亿次牌局,自行捉摸出致胜之道。

01百科:资讯不完全(Imperfect information)在经济学中,当市场中所有人都完全了解市场的价格、需求、质素、制作过程等,则达至市场资讯完全流通(perfect information)。棋类活动如过三关、围棋、象棋等,由于每个玩家都可见到棋盘上每一个活动,因此可算是资讯完全的例子。相反纸牌游戏中,由于每人都不能清楚掌握其他玩家所持有的牌,是资讯不完全的活动。

 自学成材 懂虚张声势误导对手

除此之外,以话事啤而言,以言语误导对手亦是重要部分,而Libratus亦需要学会吹牛夸大,才能成为“赌神”。更令人意想不到的是,Libratus的吹牛能力亦是自学的。布朗指:“当我看见系统向人类吹牛,我想的是,‘我没叫它这样做,我不知道它懂呢’。”

 未来或发展至商业谈判

抛窒人类对手,同时自己运算牌面,就是AI的致胜之道。布朗表示:“不是要读对手的心理、判断对手是否在夸大,这只是关乎牌面与计算。”

《卫报》分析,AI学会“抛窒”和处理不完整资讯,是AI发展的重要一步。不少范畴亦需要以不完整资讯运算判断,如商业谈判、军事策略、医疗决定等,今次AI的胜利尤如向人类宝座再近一步。

(综合报道)