Qwen3.6-Plus重磅登场：智能体能力全面进化，重塑开发新范式

May 31, 2026

在Qwen3.5系列取得惊艳表现之后，阿里巴巴近日再抛技术重磅炸弹——Qwen3.6-Plus正式发布！这绝非一次常规的版本迭代，而是一场全面的能力革命，重新定义了AI Agent的边界。

代码Agent能力跃上新高度

Qwen3.6-Plus在代码智能体领域树立了全新行业标杆：

SWE-bench Verified 得分高达78.8，紧咬业界最顶尖水准
Terminal-Bench 2.0 以61.6的成绩大幅领先所有对比模型
前端代码生成表现惊艳，QwenWebBench评分直达1502
从轻量级前端Web开发到复杂代码仓库级难题攻克，Qwen3.6-Plus均能从容驾驭，带来极致的“vibe coding”体验！🔥

通用Agent与工具调用全面突破

在长期规划任务与工具调用基准测试中，Qwen3.6-Plus展现出强大的综合实力：

DeepPlanning 斩获41.5的优异成绩，大幅甩开其他模型
MCPMark 以48.2分强势领跑，覆盖众多复杂任务场景，展现了卓越的规划与执行能力，并将推理、记忆与执行深度融合，成为真正的“全能型选手”！

通用能力持续领跑

GPQA（研究生级科学问答）得分突破90.4
指令跟随能力出类拔萃（IFEval strict prompt: 94.3）
多语言支持覆盖广泛，轻松应对多元语言环境
数学推理能力强劲，AIME26成绩达到95.3

综合基准评测一览

多模态能力三重飞跃

高级推理：复杂文档理解、物理世界视觉分析、视频推理与视觉编码实现全面突破
实际应用：针对真实商业场景深度优化，在零售智能等实战场景中表现卓著
任务执行：理解、推理与行动能力持续融合，稳步迈向原生多模态Agent

核心亮点

默认1M上下文窗口 – 超长文本处理游刃有余
显著增强的Agent编码能力 – 实战工程性能强悍
更强的多模态感知与推理 – 跨模态整合表现突出
高稳定性与可靠性 – 积极响应社区反馈，为开发者生态筑牢根基

为何选择Qwen3.6-Plus？

Qwen3.6-Plus的进步不仅体现在各项指标的全面超越，更在于有机融合了：

🔹 深度逻辑推理
🔹 广泛上下文记忆
🔹 精准工具执行

这种“全能”特质使其能够从容应对现实世界的种种挑战——从复杂的代码治理到跨领域的长期规划，标志着Qwen系列正加速向高度自主的超级智能体演进！