DeepSeek|Nvidia挫17%仍力撑:R1是出色的AI进步 符美出口要求
美国媒体报道,美股科技七雄之一(Magnificent Seven)的英伟达(Nvidia,又译辉达虽受累有关DeepSeek崛起的消息,1月27日股价大跌17%,但仍称赞DeepSeek发布的R1新模型是“一项出色的人工智能进步”(an excellent AI advancement),且符合美国对AI技术的出口限制要求。声明反驳了美国AI初创企业Scale AI行政总裁 Alexandr Wang早前的质疑,认为DeepSeek或拥有5万枚中国企业被禁运的英伟达H100处理器。
据全国广播公司商业频道(CNBC)报道,英伟达27日发声明表示,DeepSeek是一项卓越的人工智能进步,也是测试时间扩展(Test Time Scaling)的绝佳例子。DeepSeek的研究展示了如何运用该技术,借助广泛可用的模型以及完全符合出口管制规定的算力,创造出新的模型。
此前,DeepSeek上周发布了R1,这是一个开源推理模型(open-source reasoning model),该模型据报表现优于OpenAI等美国公司推出的最佳模型。 而R1的培训成本少于 600万美元(约4673万港元),开发成本远远低于硅谷科创企业打造人工智能模型所需的数十亿美元。
英伟达的公告又指,公司认为DeepSeek在开发技术时并未违反美国限制获取美国先进AI芯片的规定。
虽然市场普遍担心DeepSeek的强势崛起会降低对企业对英伟达先进芯片的需求。不过,英伟达指出运行AI模型的推理仍需要他们旗下的许多产品,指DeepSeek开发推理(Inference)过程需要大量英伟达的图像处理器(Graphics Processing Unit,GPU)和高性能网络,“如今我们有三条扩展定律:持续适用的预训练(pre-training)和后训练定律(post-training),以及新的测试时间扩展”。