DeepSeek R2拟五月登场 传全面采用华为升腾910B芯片取代NVIDIA

撰文: 许祺安
出版:更新:

在中美科技战白热化之际,中国AI新星“深度求索”(DeepSeek)再传有重大突破。市场消息透露,DeepSeek将于5月推出升级版大模型“DeepSeek R2”,不仅在技术上超越前代R1,更重要的是训练全程将不再依赖NVIDIA(中国大陆译“英伟达”,台湾译“辉达”)芯片,改为全面采用华为升腾910B(Ascend 910B)芯片集群。

陆媒《快科技》4月30日报道,DeepSeek R2将采用更先进的混合专家模型(MoE),总参数量预计达到1.2万亿,较前代R1的6710亿几乎翻倍。相较OpenAI的GPT-4,其单位推理成本大幅降低达97.4%,输入每百万字元仅需0.07美元,输出则为0.27美元。

DeepSeek的性能比肩ChatGPT,且其采用全新的训练模式,将推理模型的成本压缩到很低,还大胆地采用开源模式,令更多用户能够轻松尝试和部署AI模型。(视觉中国)

市场分析认为,这项突破将大幅减少中国对美国高端AI芯片的依赖,并可能冲击NVIDIA的市场地位。今年初,DeepSeek R1问世曾一度撼动美国AI圈,甚至引发NVIDIA股价短暂下挫,显示其对市场信心的影响不容小觑。

2025年1月30日,美国众议院指出中国DeepSeek(深度求索)推出的一款复杂AI模型使用了大量NvidiaH800芯片。(Reuters)

据悉,R2大模型的规模与OpenAI的GPT-4 Turbo及Google的Gemini 2.0 Pro相当,并将结合更智能化的门控网络层(Gating Network),以优化高负载推理任务的效能。

报道援引消息人士说法透露,R2训练全程未使用任何NVIDIAGPU,而是完全建构于华为升腾910B芯片平台,在FP16精度下的集群计算性能达512 PetaFLOPS,芯片利用率高达82%,整体性能约等于NVIDIA上一代A100集群的91%。

2019年,华为推出的AI芯片“升腾910”,号称算力最强的CPU。(视觉中国)

报道指出,华为也同步推进升腾910C芯片的量产进程,以进一步强化中国本土AI芯片供应能力。若R2如预期般性能强悍且成本低廉,将可能引发业界对AI基础设施需求的重新评估。