【AI电竞KO人类】AlphaStar战胜电竞高手 超越上一代有几劲?
继人工智能(AI)AlphaGo称霸围棋界后,人工智能研究公司DeepMind设计的新程式AlphaStar,转战即时战略游戏《星海争霸2》(StarCraft II),并完胜两名世界级职业电竞选手。
对人工智能而言,《星海争霸2》的复杂程度比棋类比赛有过之而无不及,当中涉及即时决策及长期规划等不同范筹。AlphaStar在比赛中偶然仍会犯上显而易见的错误,与最佳电竞好手仍有一段距离,但无论如何今次的胜利,不但反映“他”已超越上一代,更象征人工智能在自我学习及即时决策的重大突破。
AlphaStar自我学习更为优秀
《射雕英雄传》中周伯通创出“左右互搏”之术,事实上人工智能亦是以自我对战来进步。
AlphaGo依靠庞大的资料库学习,以找出每个棋局的“最佳版本”,然后在每一轮的自我对弈中以这个“最佳版本”不断“打倒昨日的我”。
《星际争霸2》等实时战略游戏瞬息万变,要取得胜利不再有单一的最佳策略,而是会出现相互克制的情况。所以AlphaStar在自我对战会试图发掘不同可能,以几个版本不断“打倒昨日的我们”。
这项群体自我对战的技术,能不断更新及形成集各家大成的多元网络,以助人工智能减少决策上出错的可能。
AlphaStar临场判断更胜一筹
棋类比赛大部分信息其实已在“桌上”,人工智能可以在每一轮分析对手的行动再作打算,惟AlphaStar在《星际争霸2》却要面对资讯不足的博弈,这不考验人工智能至少三方面的临场判断能力:
首先是即时决策,人工智能要每时不断侦查地图,随时间推移随时作出相应决策。
其次是操作空间,不同于传统棋类,人工智能要同时控制数百个不同的单位及建筑物,他们可以升级、移动,或是与敌人对战,牵一发动全身。
最后是长期规划,游戏中成千上万的动作和决策许多都不是立竿见影,因果关系亦不明显,依靠的就是人工智能在自我学习后所作的决策。
AlphaStar用于日常生活
研究人工智能又怎会只着眼于游戏上,最终目标当然是应用在日常生活中。《星海争霸2》的多变与现实世界甚为相似,DeepMind亦看中这一点,让这类即时战略游戏成为人工智能的试验场。
就如我们每日不停从错误中学习和成长一样,DeepMind认为,AlphaStar的自我学习能力是让人工智能技术更可靠的关键;另一方面,AlphaStar的临场判断亦可以用在其他更复杂问题上,发展人工智能的天气预测或语言理解。
(综合报道)