诺贝尔得主阿西莫格鲁评DeepSeek:人工智能“斯普特尼克时刻”?

撰文: 外部来稿(国际)
出版:更新:

尽管美国人工智能行业确实需要重新洗牌,但中国初创企业在科技巨头主导的领域实现突破的消息引发了一些棘手问题。幸运的是,如果美国科技领袖和政策制定者能从深度求索(DeepSeek)的成功中汲取正确经验,最终可能对各方都有裨益。

1月20日深度求索R1(DeepSeek-R1)模型的发布导致英伟达股价暴跌、多家科技公司市值骤降后,有人宣称这是中美人工智能霸权争夺战的“斯普特尼克时刻”。虽然美国AI行业确实需要重新洗牌,但这一事件引发了若干值得深思的问题。

美国科技界对人工智能的投资规模堪称庞大,高盛估计“科技巨头、企业和公用事业公司未来几年将在支持AI的资本支出上投入约1万亿美元”。然而长期以来,包括我在内的许多观察人士一直在质疑美国AI投资与发展的方向。

所有头部企业都遵循基本相同的策略(尽管Meta通过部分开源模式稍显不同),整个行业似乎把鸡蛋都放在同一个篮子里。无一例外,美国科技公司都痴迷于规模扩张。他们援引尚未被证实的“扩充套件法则”,假设向模型输入更多资料和算力就能解锁更强大的能力。有人甚至断言“规模就是一切”。

在1月20日之前,美国公司不愿考虑替代方案,即放弃基于海量资料集预训练、用于预测序列中下一个词的基础模型。基于这种优先考量,他们几乎只专注于扩散模型和旨在执行人类(或类人)任务的聊天机械人。虽然深度求索的方法大体相同,但其似乎更倚重强化学习、专家混合方法(使用多个更高效的小模型)、知识蒸馏和精细化思维链推理。据报道,这种策略使其能够以极小成本开发出具有竞争力的模型。

尽管有人质疑深度求索是否透露了全部细节,但该事件暴露了美国AI行业的“群体思维”。对更廉价、更具前景的替代方案的视而不见,加之过度炒作,正是西蒙·约翰逊与我在生成式AI时代开启前夕合著的《权力与进步》中所预言的。现在的问题是,美国行业是否还存在其他更危险的盲点。例如,美国科技巨头是否错失了将模型导向更“以人为本”方向的机遇?我推测答案是肯定的,但唯有时间能给出答案。

另一个问题是,中国是否正在实现弯道超车?

深度求索的成就在于工程实践:将相同方法以更高效的方式组合运用。中国企业和科研机构能否迈出下一步,开创具有颠覆性的技术、产品和路径,仍有待观察。

此外,深度求索似乎不同于多数依赖政府资助或为政府开发技术的中国AI企业。如果这家从对冲基金剥离的公司此前是在雷达之外运作,那么当其进入聚光灯下,其创造力与活力能否延续?

第三个问题涉及地缘政治。深度求索事件是否意味着美国出口管制等遏制中国AI研究的措施已然失效?答案同样不明朗。虽然深度求索使用较旧的低效能芯片训练了最新模型(V3和R1),但若要实现更大突破和扩充套件,可能仍需最尖端芯片。

不过显而易见的是,美国零和策略既不现实也不明智。这种策略唯有在相信我们正迈向人工通用智慧(能在任何认知任务中比肩人类的模型),且先实现AGI者将获得巨大地缘优势的前提下才有意义。固守这两个未经证实的假设,我们错失了与中方在诸多领域开展富有成效合作的机会。例如,若某国开发出提升人类生产力或最佳化能源管控的模型,这类创新若能广泛应用,对两国都大有裨益。

与美国同行相似,深度求索也渴望开发AGI,而创建训练成本显著降低的模型可能改变游戏规则。但通过既有方法降低开发成本,并不会在未来几年奇迹般地实现AGI。短期内能否达成AGI仍是未解之谜(其可取性则更存争议)。

尽管我们尚不掌握深度求索模型开发的全部细节,也不明确其成就对AI产业未来的全部意义,但有一点似乎显而易见:这家中国新锐企业戳破了科技界对规模扩张的执念,甚至可能动摇了其自满情绪。

本文获微信公众号“新经济学家智库”授权转载