阿里巴巴发布通义千问开源模型 称优于Deepseek美股升6.7%
撰文: 许祺安
出版:更新:
阿里巴巴旗下阿里云宣布通义千问发布Qwen 2.5-Max超大规模MoE模型,号称优于Deepseek V3,阿里美股(BABA)1月28日升6.7%。
据了解,这是通义千问首次推出原生支援100万Token上下文长度的模型,能够处理书籍、长篇报告、法律文件等超长文档,可以通过API的方式进行访问,也可以登录Qwen Chat进行体验,例如直接与模型对话,或者使用 artifacts及搜索等功能。
报道指,用户毋须进行繁琐的文档分割,该模型将能够记住更长的对话历史纪录,实现更连贯、更自然的交互体验,亦能更好地理解代码、复杂推理、多轮对话等。
据介绍,通义千问 Qwen 2.5-Max 使用超过20万亿token的预训练数据,以及精心设计的后训练方案进行训练。阿里云更直接对比了指令模型的性能表现,比较对象包括 DeepSeek V3、OpenAI旗下的GPT-4o 和 Claude-3.5-Sonnet。
阿里云指,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基准测试中,Qwen2.5-Max 的表现超越了DeepSeek V3,同时在MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩,相信随着后训练技术的不断进步,下一个版本的Qwen2.5-Max将会达到更高的水平。
DeepSeek新塑科技地缘政治 分析:台日韩成美「算力围堵」关键盟友官媒:DeepSeek遭美国IP网攻暴力破解 用户密码被破解私隐遭窃DeepSeek强势冲击AI战局 分析:北京意图宣示美出口管制无效