张美雄|黑天鹅Deepseek如何撼动全世界
来稿作者:张美雄、许仲伦
近日,中国新创公司深度求索 (后称Deepseek)横空出现,震撼了整个美国AI金融市场。令人惊讶的是,该公司运用低配芯片,竟能实现与最新OpenAI技术相媲美的效果,导致英伟达股价在开市后暴跌超过16%,市值一夜蒸发5890亿美元。究竟Deepseek是何方神圣,竟能让芯片巨头英伟达遭遇如此重创?虽然笔者各方面政经议题也有涉猎,但实在并非AI专家。为了更深入了解,我特意请教了好朋友,来自科技界的许仲伦(后称Warren)。他是魔度智慧科技的创始人,曾担任阿里人工智能实验室的总监,与Deepseek创始人一样,也是扎根于浙江省杭州市的科技人才。
Deepseek是何方神圣
Warren指出,Deepseek的母公司名为幻方量化,是一家规模超百亿的私募量化基金。Deepseek跟大家耳熟能详的ChatGPT也是一样,是一个大语言模型(后称为“大模型”),最近更推出了3.0版本。多个测试显示,这个3.0版本的效能可以匹敌Open AI的ChatGPT,同时能跟其他主流的大语言模型像Claude还有Llama 3.1不相上下,这引发了包括美国政坛以及华尔街的高度关注,“硅谷教父”Marc Andreessen更在社媒形容“DeepSeek是我所见过最amazing和impressive的技术突破之一”,这都不能不说这个黑天鹅确实是震撼了全球的资讯科技界。
那么Deepseek有什么厉害之处?其实很简单,就是它仅用了很短的训练时间、很低的训练成本,就达到了接近甚至部分可以匹配ChatGPT以及其他几个大模型的程度。有多低成本?以GPT-4o的10亿美金来算,Deepseek只用了558万美元。在只能使用因美国的出口管制原因、较落后的H800芯片,他的大模型训练效率还是比Llama高出约10倍。
Deepseek彰显了中国开发的无私共享精神
另一个值得关注的方面是,Deepseek与许多美国的AI模型不同,它采取了开源策略,公开了其程式码和训练方法,让所有人都能够访问和使用。这种透明的运作模式展现了中国在开发过程中的无私共享精神,为其他开发者提供了宝贵的参考资源。这一举措无疑与美国的保护主义形成鲜明对比,更推动了全球数字智慧技术的突破。
本文目的从来不是为了推广任何公司,上述引用的也是各大技术专案调查的实证,只希望让大众深入浅出地理解Deepseek的背景与发展。的而且确,当人们还未反应过来时,这一黑天鹅已经撼动了整个硅谷科技界,近期股票市场的波动便是证明。当然,笔者也明白,股票市场的波动从来不是由单一因素决定的,这可能只是催化剂,使华尔街找到合适的理由把估值过高的股票“甩锅”,但与此同时,也让世界看到了中国技术的潜力。
Deepseek VS ChatGPT ,亲身体验的效果
在请教了Warren之后,为了亲自体验Deepseek的威力,于是我将一个逻辑陷阱题目同时问了Deepseek和ChatGPT(iOS专用的Poe)。我的题目是:“八个人玩捉迷藏,已经有三个人被抓住,还剩下几个人藏着?”结果,Poe答出了五个,而Deepseek则给出了四个。明显地,Deepseek的回答经过了人性化的思辨,还结构化地展示了整个推理过程;而Poe的回答则陷入了思维的陷阱,只是单纯的数学计算,没有计算捉人者本身在内。这小小的例子可见,Deepseek的确潜力无限。
Deepseek的横空出现,不仅震撼了美国科技界和华尔街市场,也促使了良性竞争,除了推动了英伟达在芯片核心模组技术架构上的革新外,ChatGPT也迅速调整了商业策略,这些都是推动科技领域计算力发展的重要动力。
这不禁让我想起,即使是高举美国优先的特朗普,最近在第二次当选总统后也认清了现实:“中美可以解决世界上所有问题。”只有坚持合作共赢、追求共同发展,才能实现真正的多边主义。国家主席习近平所倡导的“构建人类命运共同体”,正正是人类寻求共赢、谋求共同发展的理想蓝图。唯有不同国家和民族携手共进,才能为全球人民的未来谋取更大的福祉。
作者张美雄是西贡区议员、大湾区青年企业家协会副会长,许仲伦是浙江省香港商会理事兼科技专委会主任、科技公司创始人。文章仅代表作者个人观点,不代表香港01立场。
“01论坛”欢迎投稿,来函请电邮至01view@hk01.com。来稿请附上作者真实姓名及联络方法。若不适用,恕不通知。