智谱 ZCode 首发评测:国产 Codex 如何让 GLM-5.2 代码生成与 UI 双双起飞
测试 GLM‑5.2 的这两天,我原本都要开始吐槽了。
但我竟然忽略了一个关键变量——ZCode!
在 Claude Code 里死活跑不通的一个题,换上 ZCode 竟然顺利出活,而且视觉和交互效果直接拉满。
所以,我决定先把 ZCode 的体验写完,然后再把所有用例从头到尾重测一遍。

然后早上又看到消息:ZCode 给新用户 5 天免费,订阅用户配额直接拉到 150%。既然如此,那肯定得让大家先玩起来再说!
很早我就在想,智谱为什么一直没推出一款像 Codex 或 Claude 那样的智能体开发套件,直到有人告诉我:他们已经做好了。

打开官网,我差点以为点进了自己的“Codex” —— 默认项目正好也叫 Gomoku。
说一模一样当然不至于,但真的很像,尤其是右侧那个悬浮控制面板。
在这类智能体程序里,Codex 的确名气更大,体验也被打磨得更好。所以一碰到风格接近的工具,就难免让人想起它。
不过嘛,它们的模仿火候跟我比,还是差那么一丢丢——开个玩笑!
我自己确实做过一个 Claude 风的版本:

界面长得很像 Opus 4.8,但里边跑着的其实是 GLM‑5.1 模型。
说它们不行,纯粹是在开涮;说我有这个软件,那可是如假包换。
本来我还想接着写 JClaude 接入 GLM 之后的丝滑体验,没想到官方自己已经拿出了自家版本,而且一上来就是 3.0.0。
计划永远赶不上变化,好多稿子写着写着就过时了。
我记得很早前似乎装过一个名字类似的工具,但那会儿更像是给 Claude Code 换了个皮。
今天,咱们就来实打实地尝一尝这个“新软件”。
官网地址:https://zcode.z.ai/
打开之后的第一屏长这样:

页面极其干净,除了顶部的导航栏,就是一个主控界面,底下还有简短的说明。
目前已经支持 Windows 和 macOS 两个平台。
下载安装包后一看,这套软件的包装还真是帅得离谱。

安装也很单纯,双击、下一步就行:

装好后开始登录:

登录提供了三种方式:用国际版账号 z.ai,用国内版 BigModel,或者直接填 API。我手上是国内订阅账号,自然选了 BigModel。没账号的话注册一个就行,国内用户当然优先用国内版本。
登录进入主界面,立刻迎来一次版本更新提醒:

界面很简单,一目了然。
我仔细瞧了瞧,居然还支持手机接入:

这点倒是挺有意思!
不过,这些都不是重点,关键还是得摸摸它真正的实力。
所以赶紧上个例子,探探深浅。
我对 GLM‑5.2 的大多数测试,本来已经在 CC 上做完了。可偏偏有一个题目从头翻到尾都失败:

刚开始是长时间卡死不动,重试以后直接报 API Error。
这个问题在之前的 5.1 版本也是一样的。那时我连续测了整整一周,每一轮都是卡住、限频,一小时也出不来任何结果。
题目是这样的:
设计一个网页:请瞬间化身为一个复古文字冒险游戏引擎。用户输入“开始”,你需生成一个随机主题(如“火星殖民地生存”或“古代修仙”)。
要求:
1. 每一步选择都要实时生成一张**ASCII艺术插图**(用字符拼成的画)来渲染场景氛围,不能重复。
2. 游戏必须包含隐藏的“蝴蝶效应”逻辑,如果用户在第 3 步选择了“捡起石头”,在第 10 步遇到怪兽时必须体现出这个选择的后果。
3. 若用户输入无理取闹的指令(如“我一拳打爆地球”),你需要用幽默的方式拒绝并引导回剧情,不能报错。
一个无限流文字冒险游戏,还融入了蝴蝶效应的设计,非常烧脑。
既然官方版来了,我就拿这个例子直接开练:

使用过程非常简单:先创建一个文件夹作为项目目录,然后选中它。
接着在左下角配置好访问权限,确认右下角的模型已经选为 GLM‑5.2,思考深度调到最高。
点发送,然后就可以一边吃瓜,一边等结果了。
我苦等了十来分钟,一度以为又没戏了。直到第十七分钟,结果竟然真的跑了出来!

官方版果然不一样,虽然也费了些时间,但至少稳稳当当地出了活。
能跑通其实还不算最关键的,真正炸裂的是:这个结果帅得离谱。

我这只能放静态截图,看不到动效。但实际加载时有一套交互动画,那体验绝对能排进我测过的同类项目里前三名。
我对 GLM 的前端审美一直没什么期待。
但是这一次,界面和交互都做得相当漂亮。
为什么 GLM‑5.2 在 ZCode 里会判若两人?
到底是抽卡碰到好运气,还是实力真的就摆在那里?
必须再追加一轮验证。
下面直接上《赛博朋克版清明上河图》,用来拷问它的能力。
这个示例很偏门,几乎不可能是事先优化过的训练题,拿来检验真实水平再合适不过。

这个例子跑了大约十分钟,修改了 506 行代码。
最终成品如下:

完成度非常可观。
虽然内容和细节还有继续挖深的空间,但整体已经没有什么硬伤。不论布局、配色还是元素设计,都稳稳处在中上水平。
给大家看一张对比效果图:

这是同一套任务,GLM‑5.2 在 Claude Code 中的产出。
即便把抽卡的波动算进去,两边的差距也太明显了。
ZCode 到底是藏着什么魔法?
为什么它产出的 UI 能漂亮这么多?
真的像是换了一个模型。
界面(UI)可以一眼看出来,但交互(UX)只有在网页上才能真正体会到高低。而交互,恰恰是特别考验能力的维度。
本文主要带大家上手感受一下 ZCode 这个工具,不打算一下子铺得太开,先用起来再说。
我接下来会把所有测试用例都搬到这里,从头到尾再跑一遍。
要验证的就两件事:UI 设计是否真的有加成?智能体的整体能力是否也被强化了?
目前还在“蜜月期”,手感真的不错。接下来,就要正式进入“考验期”了。
我的测试一旦认真起来,可是很“残暴”的哦~
更多对比数据和归纳结果,后续我们会统一整理展示,敬请期待。
