DeepSeek R2拟五月登场 传全面采用华为升腾910B芯片取代NVIDIA
撰文: 许祺安
出版:更新:
在中美科技战白热化之际,中国AI新星“深度求索”(DeepSeek)再传有重大突破。市场消息透露,DeepSeek将于5月推出升级版大模型“DeepSeek R2”,不仅在技术上超越前代R1,更重要的是训练全程将不再依赖NVIDIA(中国大陆译“英伟达”,台湾译“辉达”)芯片,改为全面采用华为升腾910B(Ascend 910B)芯片集群。
陆媒《快科技》4月30日报道,DeepSeek R2将采用更先进的混合专家模型(MoE),总参数量预计达到1.2万亿,较前代R1的6710亿几乎翻倍。相较OpenAI的GPT-4,其单位推理成本大幅降低达97.4%,输入每百万字元仅需0.07美元,输出则为0.27美元。
市场分析认为,这项突破将大幅减少中国对美国高端AI芯片的依赖,并可能冲击NVIDIA的市场地位。今年初,DeepSeek R1问世曾一度撼动美国AI圈,甚至引发NVIDIA股价短暂下挫,显示其对市场信心的影响不容小觑。
据悉,R2大模型的规模与OpenAI的GPT-4 Turbo及Google的Gemini 2.0 Pro相当,并将结合更智能化的门控网络层(Gating Network),以优化高负载推理任务的效能。
报道援引消息人士说法透露,R2训练全程未使用任何NVIDIAGPU,而是完全建构于华为升腾910B芯片平台,在FP16精度下的集群计算性能达512 PetaFLOPS,芯片利用率高达82%,整体性能约等于NVIDIA上一代A100集群的91%。
报道指出,华为也同步推进升腾910C芯片的量产进程,以进一步强化中国本土AI芯片供应能力。若R2如预期般性能强悍且成本低廉,将可能引发业界对AI基础设施需求的重新评估。