AI竞赛的世纪,香港缺席抑或只是迟到?
杭州企业深度求索推出最新的人工智能DeepSeek-R1一星期以来,为人工智能、创新科技界以至金融市场带来重大冲击。根据柏克莱加州大学研究人员营运的Chatbot Arena排名,R1已经挤上第三名,与ChatGPT最高分的模型并列,仅次于Google两个最前沿的Gemini模型。深度求索上个月推出的V3亦位列第八,比xAI的Grok和Anthropic的Claude都要优胜。
DeepSeek震撼之处不只因为表现出色,关键更在于背景。根据深度求索的公布,V3模型花费了接近560万美元。这相当于GPT模型训练成本的不到十分之一,而Anthropic研发一个模型的费用也要一亿至十亿美元不等。而且面对高阶芯片的禁运,V3用的是2048块英伟达(辉达)用于内地市场的低配版H800 GPU,训练时间仅55天。这是为什么DeepSeek被称为“AI界的拼多多”,其创办人梁文峰上星期甚至获邀参加国务院总理李强主持的座谈会,以创科企业家的身份发言。
量化投资起家 南下香港持牌
事实上,梁文峰与香港并不遥远。这不是指地理上,他在广东省长大,是湛江人。梁文峰自从在浙江大学修读机器视觉以后,基本上都在杭州打滚,包括跟同样是淅大毕业的朋友在于2015年创立投资公司幻方。他们以电脑计算来进行交易,花了六年时间达到千亿元管理规模,是内地所谓“量化四大天王”之一。
说梁文峰与香港不遥远,是因为幻方资本早于2019年已来香港拓展业务,在证监会规管下持牌提供资产管理。当然,这是因为幻方取得境外投资者的身份重返A股市场,所享有的自主程度较高,但这同时说明了香港作为背靠内地、面向国际的金融中心,始终有其优越之处。当年梁文峰在上海一个论坛上曾经指出,投资者分技术面和基本面两种流派,而他们专攻的量化程序主要是赚技术面流派原本赚的钱,而且对冲基金桥水也是做宏观量化。
由应用金融科技 到研发人工智能
不过梁文峰没有止步于量化投资,反而透过幻方资本的班底,另外成立人工智能公司深度求索,由原本的应用层面退后一步到科研层面,投资近二亿元设立搭载1100加速卡的“萤火一号”,支持人工智能的运算。两年后“萤火二号”的成本增加到十亿元,搭载约一万张英伟达A100显示卡。及至2023年,他们已经完全转型到研发人工智能的领域,而且是内地除了商汤、百度、腾讯、字节跳动和阿里五大巨头以外,唯一拥有超过一万张A100显示卡的公司。
余下的就是历史——去年5月发表V2,价格仅GPT-4 Turbo的百分之一;同年12月V3成为人工智能界新宠儿,表现挤进十大之列;上星期推出R1,效能甚至力压OpenAI o1。矽谷不少人为此惊讶,体会到资源限制反而激发了创新能力。梁文峰就自言中国不能只是搭便车,也要逐步成为贡献者。
香港赶建超算中心 河套园区尚待建成
回看香港,我们虽然错过了大疆,金融投资又没有衍生出人工智能研发,但这届政府还是提出了建立人工智能超算中心,预计可以提供每秒浮点运算三千千万亿次(即3000 petaFLOPS)的算力,并拨款30亿元资助本地大学、研发机构及企业善用超算中心,应用算力赋能技术创新和产业发展。当局相信超算中心及人工智能实验室将会引领香港迈进人工智能新时代,又谓美国的任何贸易限制也不会动摇香港发展成为国际创科中心的坚定决心。但香港发展创科的具体KPI是什么?我们何时会有——或者会不会有——自主研发的ChatGPT、DeepSeek?一间深度求索、一个人工智能模型,不正是创科发展不受动摇的最佳证明吗?只不过故事中的主角是杭州而非我们。
河套香港园区第一期第一批次的大楼陆续完工并投入服务,但要汇聚海内外顶尖的研发团队和优秀的创科企业,从科学园和数码港的例子可知,远不是建设了园区和硬件就足以成事。更何况长远而言,河套合作区是要成为世界级科技创新枢纽,也就是媲美美国矽谷的水平。但特朗普甫重返白宫,就扬言为了胜过中国,他将积极推动美国发展人工智能及其基建。香港在廿一世纪的AI竞赛中将会是缺席抑或只是迟到,视乎我们是否先读懂杭州和深圳是如何缔造一间又一间创科奇迹。