半导体研究机构:DeepSeek硬体投资或逾5亿美元
撰文: 成依华
出版:更新:
中国人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因性价比高而广受关注,成本多少成为外界焦点,半导体研究机构SemiAnalysis发表报告,估计DeepSeek公司历年来的硬体投资支出为远高于5亿美元(约39亿港元)。
DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的训练成本为557.6万美元(约4,349万港元),低廉的成本引起关注。文件注明成本仅包括V3的官方训练(official training),不包括与架构、演算法或资料相关的先前研究和消融实验(ablation experiments)的成本。
半导体研究与咨询机构SemiAnalysis发表报告,估计DeepSeek公司的历来硬体投资支出为远高于5亿美元(约39亿港元),并指研发成本和整体成本也相当可观,称为模型训练制作“合成资料”需要大量的计算力。
报告称“为开发新的架构方法,在模型开发过程中,需要花费大量资金来测试新想法、新的架构理念和消融(ablations)。”
2023年时,外界估计OpenAI的GPT-4训练成本达到6300万美元(约4.9亿港元)。
DeepSeek触动多国神经 美国得州政府与NASA禁部门使用 荷兰调查特朗普晤黄仁勋 路透社:两人讨论DeepSeek及AI芯片出口DeepSeek冲击市场 OpenAI行政总裁:公司领先地位被削弱