智谱 ZCode 首发评测：国产 Codex 如何让 GLM-5.2 代码生成与 UI 双双起飞

June 19, 2026

测试 GLM‑5.2 的这两天，我原本都要开始吐槽了。

但我竟然忽略了一个关键变量——ZCode！

在 Claude Code 里死活跑不通的一个题，换上 ZCode 竟然顺利出活，而且视觉和交互效果直接拉满。

所以，我决定先把 ZCode 的体验写完，然后再把所有用例从头到尾重测一遍。

然后早上又看到消息：ZCode 给新用户 5 天免费，订阅用户配额直接拉到 150%。既然如此，那肯定得让大家先玩起来再说！

很早我就在想，智谱为什么一直没推出一款像 Codex 或 Claude 那样的智能体开发套件，直到有人告诉我：他们已经做好了。

打开官网，我差点以为点进了自己的“Codex” —— 默认项目正好也叫 Gomoku。

说一模一样当然不至于，但真的很像，尤其是右侧那个悬浮控制面板。

在这类智能体程序里，Codex 的确名气更大，体验也被打磨得更好。所以一碰到风格接近的工具，就难免让人想起它。

不过嘛，它们的模仿火候跟我比，还是差那么一丢丢——开个玩笑！

我自己确实做过一个 Claude 风的版本：

界面长得很像 Opus 4.8，但里边跑着的其实是 GLM‑5.1 模型。

说它们不行，纯粹是在开涮；说我有这个软件，那可是如假包换。

本来我还想接着写 JClaude 接入 GLM 之后的丝滑体验，没想到官方自己已经拿出了自家版本，而且一上来就是 3.0.0。

计划永远赶不上变化，好多稿子写着写着就过时了。

我记得很早前似乎装过一个名字类似的工具，但那会儿更像是给 Claude Code 换了个皮。

今天，咱们就来实打实地尝一尝这个“新软件”。

官网地址：https://zcode.z.ai/

打开之后的第一屏长这样：

页面极其干净，除了顶部的导航栏，就是一个主控界面，底下还有简短的说明。

目前已经支持 Windows 和 macOS 两个平台。

下载安装包后一看，这套软件的包装还真是帅得离谱。

安装也很单纯，双击、下一步就行：

装好后开始登录：

登录提供了三种方式：用国际版账号 z.ai，用国内版 BigModel，或者直接填 API。我手上是国内订阅账号，自然选了 BigModel。没账号的话注册一个就行，国内用户当然优先用国内版本。

登录进入主界面，立刻迎来一次版本更新提醒：

界面很简单，一目了然。

我仔细瞧了瞧，居然还支持手机接入：

这点倒是挺有意思！

不过，这些都不是重点，关键还是得摸摸它真正的实力。

所以赶紧上个例子，探探深浅。

我对 GLM‑5.2 的大多数测试，本来已经在 CC 上做完了。可偏偏有一个题目从头翻到尾都失败：

刚开始是长时间卡死不动，重试以后直接报 API Error。

这个问题在之前的 5.1 版本也是一样的。那时我连续测了整整一周，每一轮都是卡住、限频，一小时也出不来任何结果。

题目是这样的：

设计一个网页：请瞬间化身为一个复古文字冒险游戏引擎。用户输入“开始”，你需生成一个随机主题（如“火星殖民地生存”或“古代修仙”）。  
  
要求：  
  
1. 每一步选择都要实时生成一张**ASCII艺术插图**（用字符拼成的画）来渲染场景氛围，不能重复。  
2. 游戏必须包含隐藏的“蝴蝶效应”逻辑，如果用户在第 3 步选择了“捡起石头”，在第 10 步遇到怪兽时必须体现出这个选择的后果。  
3. 若用户输入无理取闹的指令（如“我一拳打爆地球”），你需要用幽默的方式拒绝并引导回剧情，不能报错。

一个无限流文字冒险游戏，还融入了蝴蝶效应的设计，非常烧脑。

既然官方版来了，我就拿这个例子直接开练：

使用过程非常简单：先创建一个文件夹作为项目目录，然后选中它。

接着在左下角配置好访问权限，确认右下角的模型已经选为 GLM‑5.2，思考深度调到最高。

点发送，然后就可以一边吃瓜，一边等结果了。

我苦等了十来分钟，一度以为又没戏了。直到第十七分钟，结果竟然真的跑了出来！

官方版果然不一样，虽然也费了些时间，但至少稳稳当当地出了活。

能跑通其实还不算最关键的，真正炸裂的是：这个结果帅得离谱。

我这只能放静态截图，看不到动效。但实际加载时有一套交互动画，那体验绝对能排进我测过的同类项目里前三名。

我对 GLM 的前端审美一直没什么期待。

但是这一次，界面和交互都做得相当漂亮。

为什么 GLM‑5.2 在 ZCode 里会判若两人？

到底是抽卡碰到好运气，还是实力真的就摆在那里？

必须再追加一轮验证。

下面直接上《赛博朋克版清明上河图》，用来拷问它的能力。

这个示例很偏门，几乎不可能是事先优化过的训练题，拿来检验真实水平再合适不过。

这个例子跑了大约十分钟，修改了 506 行代码。

最终成品如下：

完成度非常可观。

虽然内容和细节还有继续挖深的空间，但整体已经没有什么硬伤。不论布局、配色还是元素设计，都稳稳处在中上水平。

给大家看一张对比效果图：

这是同一套任务，GLM‑5.2 在 Claude Code 中的产出。

即便把抽卡的波动算进去，两边的差距也太明显了。

ZCode 到底是藏着什么魔法？

为什么它产出的 UI 能漂亮这么多？

真的像是换了一个模型。

界面（UI）可以一眼看出来，但交互（UX）只有在网页上才能真正体会到高低。而交互，恰恰是特别考验能力的维度。

本文主要带大家上手感受一下 ZCode 这个工具，不打算一下子铺得太开，先用起来再说。

我接下来会把所有测试用例都搬到这里，从头到尾再跑一遍。

要验证的就两件事：UI 设计是否真的有加成？智能体的整体能力是否也被强化了？

目前还在“蜜月期”，手感真的不错。接下来，就要正式进入“考验期”了。

我的测试一旦认真起来，可是很“残暴”的哦～

更多对比数据和归纳结果，后续我们会统一整理展示，敬请期待。