【柯洁对AlphaGo】点解AlphaGo咁厉害？AI比去年对李世石时强多倍

撰文：林勇

出版：2017-05-24 10:00更新：2025-02-12 00:09

人类对AI“终极一战”，由世界第一棋王柯洁对AlphaGo的首场对局展开战幔。不过，第一场对奕，无论柯洁是如何顽强抵抗，最后还是仅败给AlphaGo。究竟为什么AlphaGo的棋力那么惊人？开发AlphaGo的DeepMind更说AlphaGo 现在的棋力比去年与李世乭对战时强得多！

不少棋手赞叹AlphaGo的下棋节奏以及出招狠准程度已非一般高手可媲美。（林勇摄）

要了解AlphaGo的强，首先要了解AlphaGo是什么。由Demis Hassabis、Shane Legg 及 Mustafa Suleyman于2010年创立DeepMind，开发了电脑AI系统AlphaGo，更是第一个击败人类职业围棋选手及世界冠军的电脑AI程式。去年3月，AlphaGo经过5局的对弈，最终以 4 比 1 的总比分战胜了围棋世界冠军李世乭，更是人工智能领域中重要里程碑。AlphaGo凭着“充满创意且机智”的下法，跻身围棋界最高称号“职业九段行列”，更成为历史上首个获得该荣誉的非人类棋手。

【柯洁对AlphaGo】现场直击决战场地“乌镇互联网国际会展中心” （按此前往页面）

DeepMind创办人之一Demis Hassabis，指AlphaGo完成这几场对奕后，才会公布接下来的目标。（林勇摄）

年初AlphaGo 2.0就以以“Master / Magister”名字，与世界顶级围棋选手进行了60场网上快棋对局，并取得全胜战绩。这些对战，都是AlphaGo自我进化的最佳素材。围棋一直以来都被认为是AI最具挑战性的项目，因为它包含了庞大的搜索空间，对于落子位置的评估难度已远远超过了简单的演算法。为此，AlphaGo采用了新颖的机器学习技术，结合了监督学习和强化学习的优势，再通过不断训练自我形成一个策略网络（policy network），以棋盘上的局势作为输入资讯，并对所有可行的落子位置产生一个概率分布，从而训练出一个价值网络路（value network），再对自我对弈进行预测，预测所有可行落子位置的结果。新版AlphaGo产生大量自我对弈棋局，为下一代版本提供了训练资料，此过程循环往复，可提升棋力。

柯洁首战对败给AlphaGo，心服口服。（林勇摄）

目前最新版本的AlphaGo是利用云端（Cloud Computing）上以单TPU（Tensor Processing Unit）运行，亦即是早前Goolge I/O开发者大会上所公布的最新版本。TPU 是专门为机器学习而设计的处理器，相比去年3月与李世乭的比赛，最新版本在处理计算时所消耗的电量仅为以往的10分之1，可以在最低的功耗下发挥最大的效能。

柯洁在赛后更指，“AlphaGo不单下了好棋，更制造了很多一石二鸟的‘劫材’。AlphaGo 实在出色，这一局输得心服口服。”

【柯洁对AlphaGo】现场直击决战场地“乌镇互联网国际会展中心”【柯洁大战AlphaGo】最强人类首轮告负：“它几乎是围棋上帝！”【AlphaGo】人机大战以外　Google真对手实是Tim Cook、整个矽谷【AlphaGo】柯洁以外：盘点围棋界“颜值爆棚”美女棋手【柯洁战AlphaGo】“人类最后一场抵抗”　柯洁还有哪些最后优势【柯洁战AlphaGo】AI再进化　最强棋手“拼死一搏”还有何意义？足本重播：AlphaGo下棋快三倍险胜1/4子　柯洁：它第54手太出色！