中国新AI大模型DeepSeek强在哪里?基准测试排名升至全类别第3位

撰文: 中关村在线
出版:更新:

游戏科学创始人、CEO冯骥在1月26日晚发文谈到了一个名为DeepSeek的科技成果。他认为,如果有一个AI大模型具备以下任何一项突破,都将成为超级科技,而DeepSeek同时实现了这些突破。

游戏科学创始人、CEO冯骥对DeepSeek有高度评价。(微博)

首先,它拥有强大的推理能力,与O1相当,并且价格更实惠。其次,它是开源的,任何人都可以自行下载和部署,并提供了详细的训练步骤和技巧说明,甚至可以在手机上运行。此外,它还支持联网搜索功能(目前唯一支持联网搜索的推理模型),并且由一家中国本土团队开发完成。

游戏科学创始人、CEO冯骥加推AI大模型DeepSeek:

+9

冯骥强烈推荐大家使用DeepSeek,并希望它的R1版本能够让人们对当前最先进的AI技术感到惊艳。他非常高兴看到这样一个纯粹的中国公司取得如此震撼的突破,这使得知识与讯息更加平等。

根据资料显示,DeepSeek来自国内大模型公司深度求索旗下的量化巨头幻方量化的子品牌。该公司于1月20日正式发布了名为“DeepSeek-R1”的推理大模型,在海外开发者社区中引起了轰动。

DeepSeek在基准测试排名升至全类别第3位(deepseek)

延伸阅读:生成式AI应用100强 ChatGPT霸榜挑战者出现 消费者最爱是这些(点击连结看全文)

+14

该模型是一种开源模型,其性能在数学、代码、自然语言推理等任务上能够比肩OpenAI o1模型正式版,并采用了MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三位。

另外值得注意的是,在苹果App Store中国区免费榜中,DeepSeek成为中国区第一;而在美区苹果App Store免费榜中,它升至第六位,超过了美国科技公司的生成式AI产品如Google Gemini、Microsoft Copilot等。这些结果表明了DeepSeek在用户群体中取得了良好的反响。

延伸阅读:大英百科全书正式跨入AI市场 活化石有新把戏 IPO预估10亿美元(点击连结看全文)

+7

【本文获“中关村在线”授权转载。】