Kimi 2.6实测超级玛丽:配额猛烧63%,生成游戏不会跳,惨成挨打现场
让 AI 用一句话写出《超级玛丽》,这个测试继续进行!
在测完国内最强的 GLM‑5.1 之后,我们把目光转向号称国内第二的 Kimi 2.6。
Kimi 这次的表现,可以说是“非常精彩”,精彩到我一时都不知道该从哪里开始吐槽。
直接上图,大家先感受一下:

各位什么感想?这真的是超级玛丽?玛丽在哪儿?管道呢?蘑菇呢?
感觉已经不必多评,这种结果……根本没法打分了。
我偏不信邪,也许只是我运气太好,直接抽到了废卡。
于是又专门用 Kimi Code 重新跑了一遍。
这次倒是好了一点,但依然“抽象”得让人哭笑不得。
视频里展示的生成立绘是这样的:
看上去是能玩了,但完全玩不久。游戏里压根没有跳跃功能,唯一能让玛丽跳起来的方式,就是——死掉。
视频就摆在这儿,我也不想再多说,总之这肯定不是我们记忆中的超级玛丽。
第二个例子更刺激,是直接用它们官方智能体工具跑的。
这样应该最能反映出真实水准了吧。
跑的时候拖了很久很久,久到我以为这次稳了。
来看看它吐出来的这些东西,确实显得相当专业。
过程中还修复了好几个潜在 Bug,最后给出的报告也异常详实,生成的文件数量是所有尝试里最多的。
项目结构长这样:
index.html # 游戏入口
css/game.css # 样式
js/
input.js # 键盘输入
audio.js # Web Audio 音效
level.js # 第一关完整地图
mario.js # 马里奥物理/状态机/碰撞
enemy.js # 敌人 AI(Goomba / Koopa)
item.js # 道具与火球
renderer.js # Canvas渲染与相机
game.js # 主循环与游戏逻辑
已经实现的核心玩法列得也很诱人:
• World 1‑1 完整关卡:地面、砖块、问号块、管道、楼梯、6个坑洞、终点旗杆与城堡
• 马里奥状态机:小/大/火焰花三种形态,支持可变高度跳跃、奔跑加速、发射火球
• 敌人AI:Goomba 直线巡逻+智能转身不掉坑;Koopa 可踩成龟壳,踢飞后能撞死其他敌人/碎砖
• 道具系统:蘑菇变大、火焰花、顶问号块出金币/道具、100币奖命
• 碰撞检测:精确的AABB瓦片碰撞,支持从下方顶砖块(大马里奥可破砖)
• 通关流程:碰到旗杆→滑下→走进城堡→胜利画面
• UI 与音效:分数/金币/时间显示、跳跃/金币/顶砖/踩敌/死亡/通关音效
操作方式:
• ← → 移动
• Z 或 空格 跳跃(按住跳得更高)
• X 或 Shift 加速跑 / 火焰花状态下发射火球
最后它还贴心地告诉我:直接在浏览器打开 index.html 就能玩,祝我通关愉快!
我只能说,通关是绝对不可能的,但愉快地结束倒是真的。
当然,也有非常不愉快的地方:

为了跑完这一个例子,我大概用了 2 到 3 个 5 小时周期,烧掉了整整 63% 的周配额!!!
你们能想象吗?就为了这么一个结果,我搭进去大半个星期的配额,还干等了十几个小时。
时间全浪费了,得到的却是一坨难以名状的东西。
Kimi 在这个测试项目里的表现,真的非常弱,基本就是垫底的选手。
为什么满世界都在说这个强、那个牛,可我随手一测就翻车?
也许我总是能发现别人发现不了的问题,又或者是别人发现了,但不愿意说出来吧。
刚写完这些,听说 Kimi 2.7 已经来了,看样子又有得玩了。
按照我的习惯,我上传了第一个版本,你们可以去试试,感受一下什么叫“干瞪眼”现场。

说实话,K2.6 完全没必要体验,但其他几个模型倒是可以玩一玩,某些结果别有风味,而做得最出色的依然是 Fable 5,还原度高得离谱,真正断代领先。
最后再强调一次,我的测试不针对任何人,只是把真实情况如实发出来罢了。
可以点赞了!😎
