Qwen3.6-Plus重磅登场:智能体能力全面进化,重塑开发新范式
在Qwen3.5系列取得惊艳表现之后,阿里巴巴近日再抛技术重磅炸弹——Qwen3.6-Plus正式发布!这绝非一次常规的版本迭代,而是一场全面的能力革命,重新定义了AI Agent的边界。
代码Agent能力跃上新高度

Qwen3.6-Plus在代码智能体领域树立了全新行业标杆:
- SWE-bench Verified 得分高达78.8,紧咬业界最顶尖水准
- Terminal-Bench 2.0 以61.6的成绩大幅领先所有对比模型
- 前端代码生成表现惊艳,QwenWebBench评分直达1502
- 从轻量级前端Web开发到复杂代码仓库级难题攻克,Qwen3.6-Plus均能从容驾驭,带来极致的“vibe coding”体验!🔥

通用Agent与工具调用全面突破

在长期规划任务与工具调用基准测试中,Qwen3.6-Plus展现出强大的综合实力:
- DeepPlanning 斩获41.5的优异成绩,大幅甩开其他模型
- MCPMark 以48.2分强势领跑,覆盖众多复杂任务场景,展现了卓越的规划与执行能力,并将推理、记忆与执行深度融合,成为真正的“全能型选手”!
通用能力持续领跑
- GPQA(研究生级科学问答)得分突破90.4
- 指令跟随能力出类拔萃(IFEval strict prompt: 94.3)
- 多语言支持覆盖广泛,轻松应对多元语言环境
- 数学推理能力强劲,AIME26成绩达到95.3
综合基准评测一览
多模态能力三重飞跃
- 高级推理:复杂文档理解、物理世界视觉分析、视频推理与视觉编码实现全面突破
- 实际应用:针对真实商业场景深度优化,在零售智能等实战场景中表现卓著
- 任务执行:理解、推理与行动能力持续融合,稳步迈向原生多模态Agent

核心亮点
- 默认1M上下文窗口 – 超长文本处理游刃有余
- 显著增强的Agent编码能力 – 实战工程性能强悍
- 更强的多模态感知与推理 – 跨模态整合表现突出
- 高稳定性与可靠性 – 积极响应社区反馈,为开发者生态筑牢根基
为何选择Qwen3.6-Plus?
Qwen3.6-Plus的进步不仅体现在各项指标的全面超越,更在于有机融合了:
🔹 深度逻辑推理
🔹 广泛上下文记忆
🔹 精准工具执行
这种“全能”特质使其能够从容应对现实世界的种种挑战——从复杂的代码治理到跨领域的长期规划,标志着Qwen系列正加速向高度自主的超级智能体演进!