【AI电竞KO人类】AlphaStar战胜电竞高手 超越上一代有几劲?

撰文: 凌俊贤
出版:更新:

继人工智能(AI)AlphaGo称霸围棋界后,人工智能研究公司DeepMind设计的新程式AlphaStar,转战即时战略游戏《星海争霸2》(StarCraft II),并完胜两名世界级职业电竞选手。
对人工智能而言,《星海争霸2》的复杂程度比棋类比赛有过之而无不及,当中涉及即时决策及长期规划等不同范筹。AlphaStar在比赛中偶然仍会犯上显而易见的错误,与最佳电竞好手仍有一段距离,但无论如何今次的胜利,不但反映“他”已超越上一代,更象征人工智能在自我学习及即时决策的重大突破。

AI电竞KO人类:《星际争霸2》在2010年推出,玩家可操作人类、虫族或神族对战。这个游戏易学难精,要求玩家有卓越的操控技巧,是受欢迎的专业电子电竞游戏之一。图为2017年的电竞比赛。(Getty Images)

AlphaStar自我学习更为优秀

《射雕英雄传》中周伯通创出“左右互搏”之术,事实上人工智能亦是以自我对战来进步。

AlphaGo依靠庞大的资料库学习,以找出每个棋局的“最佳版本”,然后在每一轮的自我对弈中以这个“最佳版本”不断“打倒昨日的我”。

《星际争霸2》等实时战略游戏瞬息万变,要取得胜利不再有单一的最佳策略,而是会出现相互克制的情况。所以AlphaStar在自我对战会试图发掘不同可能,以几个版本不断“打倒昨日的我们”。

这项群体自我对战的技术,能不断更新及形成集各家大成的多元网络,以助人工智能减少决策上出错的可能。

AI电竞KO人类:AlphaStar会自我对战中发掘不同可能,再不断分叉下去互相对战,以助人工智能减少决策上出错的可能。(DeepMind 官网)

AlphaStar临场判断更胜一筹

棋类比赛大部分信息其实已在“桌上”,人工智能可以在每一轮分析对手的行动再作打算,惟AlphaStar在《星际争霸2》却要面对资讯不足的博弈,这不考验人工智能至少三方面的临场判断能力:

首先是即时决策,人工智能要每时不断侦查地图,随时间推移随时作出相应决策。

其次是操作空间,不同于传统棋类,人工智能要同时控制数百个不同的单位及建筑物,他们可以升级、移动,或是与敌人对战,牵一发动全身。

最后是长期规划,游戏中成千上万的动作和决策许多都不是立竿见影,因果关系亦不明显,依靠的就是人工智能在自我学习后所作的决策。

AI电竞KO人类:AlphaStar在《星际争霸2》要不断侦查地图,随时间推移随时作出相应决策。图为AlphaStar与对手“MaNa”对战。(DeepMind 官网)

AlphaStar用于日常生活

研究人工智能又怎会只着眼于游戏上,最终目标当然是应用在日常生活中。《星海争霸2》的多变与现实世界甚为相似,DeepMind亦看中这一点,让这类即时战略游戏成为人工智能的试验场。

就如我们每日不停从错误中学习和成长一样,DeepMind认为,AlphaStar的自我学习能力是让人工智能技术更可靠的关键;另一方面,AlphaStar的临场判断亦可以用在其他更复杂问题上,发展人工智能的天气预测或语言理解。

AI电竞KO人类:研究团队希望,AlphaStar不只应用在“捉棋”或电竞,而是助人工智能应用在日常生活中。(视觉中国)

(综合报道)