【柯洁对AlphaGo】点解AlphaGo咁厉害?AI比去年对李世石时强多倍
人类对AI“终极一战”,由世界第一棋王柯洁对AlphaGo的首场对局展开战幔。不过,第一场对奕,无论柯洁是如何顽强抵抗,最后还是仅败给AlphaGo。究竟为什么AlphaGo的棋力那么惊人?开发AlphaGo的DeepMind更说AlphaGo 现在的棋力比去年与李世乭对战时强得多!
要了解AlphaGo的强,首先要了解AlphaGo是什么。由Demis Hassabis、Shane Legg 及 Mustafa Suleyman于2010年创立DeepMind,开发了电脑AI系统AlphaGo,更是第一个击败人类职业围棋选手及世界冠军的电脑AI程式。去年3月,AlphaGo经过5局的对弈,最终以 4 比 1 的总比分战胜了围棋世界冠军李世乭,更是人工智能领域中重要里程碑。AlphaGo凭着“充满创意且机智”的下法,跻身围棋界最高称号“职业九段行列”,更成为历史上首个获得该荣誉的非人类棋手。
【柯洁对AlphaGo】现场直击决战场地“乌镇互联网国际会展中心” (按此前往页面)
年初AlphaGo 2.0就以以“Master / Magister”名字,与世界顶级围棋选手进行了60场网上快棋对局,并取得全胜战绩。这些对战,都是AlphaGo自我进化的最佳素材。围棋一直以来都被认为是AI最具挑战性的项目,因为它包含了庞大的搜索空间,对于落子位置的评估难度已远远超过了简单的演算法。为此,AlphaGo采用了新颖的机器学习技术,结合了监督学习和强化学习的优势,再通过不断训练自我形成一个策略网络(policy network),以棋盘上的局势作为输入资讯,并对所有可行的落子位置产生一个概率分布,从而训练出一个价值网络路(value network),再对自我对弈进行预测,预测所有可行落子位置的结果。新版AlphaGo产生大量自我对弈棋局,为下一代版本提供了训练资料,此过程循环往复,可提升棋力。