阿里巴巴发布通义千问开源模型　称优于Deepseek美股升6.7%

撰文：许祺安

出版：2025-01-29 13:53更新：2025-01-29 16:28

阿里巴巴旗下阿里云宣布通义千问发布Qwen 2.5-Max超大规模MoE模型，号称优于Deepseek V3，阿里美股（BABA）1月28日升6.7%。

据了解，这是通义千问首次推出原生支援100万Token上下文长度的模型，能够处理书籍、长篇报告、法律文件等超长文档，可以通过API的方式进行访问，也可以登录Qwen Chat进行体验，例如直接与模型对话，或者使用 artifacts及搜索等功能。

报道指，用户毋须进行繁琐的文档分割，该模型将能够记住更长的对话历史纪录，实现更连贯、更自然的交互体验，亦能更好地理解代码、复杂推理、多轮对话等。

据介绍，通义千问 Qwen 2.5-Max 使用超过20万亿token的预训练数据，以及精心设计的后训练方案进行训练。阿里云更直接对比了指令模型的性能表现，比较对象包括 DeepSeek V3、OpenAI旗下的GPT-4o 和 Claude-3.5-Sonnet。

阿里云指，在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现超越了DeepSeek V3，同时在MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩，相信随着后训练技术的不断进步，下一个版本的Qwen2.5-Max将会达到更高的水平。

DeepSeek新塑科技地缘政治　分析：台日韩成美｢算力围堵｣关键盟友官媒：DeepSeek遭美国IP网攻暴力破解　用户密码被破解私隐遭窃 DeepSeek强势冲击AI战局　分析：北京意图宣示美出口管制无效

阿里巴巴

AI人工智能

DeepSeek

阿里巴巴发布通义千问开源模型 称优于Deepseek美股升6.7%

阿里巴巴发布通义千问开源模型　称优于Deepseek美股升6.7%