Claude Code用户的三重境界:你是抄代码的,还是指挥AI军团的?附自测表
王国维在《人间词话》里提到,古今之成大事业者,必经三种境界。文学我不在行,但混了一段时间AI编程社区之后,我发现AI编程这件事同样存在三重境界——可惜绝大多数人卡在第二层,还浑然不觉。
先看两组数字让你清醒一下:84% 的开发者已经用上了AI编程工具。可独立评估机构METR的一项对照实验显示,让16位经验丰富的程序员用AI完成246个任务时——他们反倒慢了19%。
更黑色幽默的是,这些参与者自认为快了20%。
工具越来越强,人类反而越干越慢,还自我感觉良好。毛病不在工具上,在思维模式上。
你觉得自己用上AI之后,是快是慢?到留言区坦白交代吧。
我用Claude Code做了大半年的日常开发,又参考了Google的Addy Osmani、Steve Yegge、Peter van Hees等人总结的AI编程成熟度模型,加上Claude Code创建者Boris的亲传心法,消化下来,将整个演进路径简化成三层境界。
不多不少,就三层。多了你记不住,也没那个必要。
第一重境界:让AI替你写代码
你目前的做法
打开IDE,装好Copilot或Cursor,AI开始在光标后面弹出灰色代码提示。你按Tab采纳,Esc拒绝。偶尔打开侧边对话窗口,丢一句"帮我写个解析JSON的函数",然后把生成的代码粘进工程里。
也可能你已经用上了Claude Code,但使用方式还是老一套:打开终端,给一句含糊的需求,等AI吐出代码,瞄一眼能编译就算通过。
这个层次的特征
| 维度 | 表现 |
|---|---|
| 交互方式 | 提示词驱动,想到哪儿问到哪儿 |
| AI角色 | 高级键盘,打字加速器 |
| 任务粒度 | 功能级——“帮我写个登录页” |
| 上下文管理 | 基本不管,让AI自己猜 |
| 质量保障 | 能编译即可 |
Peter van Hees把这类人称为"提示员"和"计划员"——AI在你手里就是个打字加速器。把需求往聊天框一扔,AI甩回来一坨代码,你复制粘贴、改改就上线。
这一层有毛病吗?没有。尤其在写CRUD、生成样板代码、查API语法的时候,确实能省下不少时间。
但问题恰恰在于,84%的开发者都停在原地。
Google DORA 2024研究里有一条扎心的结论:AI采用率每提高25%,交付速度反而下降1.5%,系统稳定性下降7.2%。AI协作提交的Pull Request,出问题的概率是人类独立完成的1.7倍。
为什么会这样?因为这一层有一个致命伤——van Hees称之为**“上下文近视”**。
你的每一条提示词都是孤立的。AI不知道你的系统架构长什么样,不知道上周你为什么选了方案A而不是方案B,不知道哪些模块之间存在隐藏的依赖。它只能看见当前这段对话,然后从统计概率最高的选项里挑一个答案递给你。
Addy Osmani概括得直截了当:
“如果你给LLM一个含糊的需求,让它直接开写,它很可能产出一段’十个开发者在零沟通的情况下各写各的’风格的代码——逻辑重叠,架构混乱,连方法命名都对不上。”
怎么判断自己在这一层
问自己一个问题:上一次你让AI写代码之前,先动手写过一份规格说明文档,是什么时候?
如果答案是"从来没写过"——恭喜,你就在这一层。
突破的方法
不是让你去啃什么高深的提示词工程。核心只有一条:在动手写代码之前,先把需求想透。
用Claude Code的话,可以这样起步:
我想做一个用户登录模块。在开始写代码之前,请先问我问题,
直到你完全理解所有细节为止。然后把讨论结果整理成 spec.md。
这一步看起来慢,实际上省下的调试时间比你想象的多得多。Addy Osmani管这叫"15分钟内的瀑布"——快速的结构化规划,让后面的编码顺畅无比。
一旦你开始在Claude Code里维护CLAUDE.md文件,开始为项目写规格文档,开始在让AI写代码之前先写好测试——你就已经望向第二层了。
第二重境界:让AI替你干活
你正在做的事情
你不再去IDE的聊天侧边栏闲聊了。你直接打开终端,跟Claude Code对话,告诉它"按spec.md实现Step 3",然后它自己读文件、改代码、跑测试、修Bug,你只需要在旁边盯着。
用Boris(Claude Code创建者)的话说——他30天完成了259个PR,每一行代码都由AI亲自编写。
这个层次的特征
| 维度 | 表现 |
|---|---|
| 交互方式 | 目标驱动,AI自主执行 |
| AI角色 | 结对编程搭档 |
| 任务粒度 | 任务级——“按计划实现Step 3” |
| 上下文管理 | CLAUDE.md + spec文档 |
| 质量保障 | AI自行跑测试,人只看结果 |
Steve Yegge的8级模型里,这一层对应第4到第5级:开发者不再逐行审查AI写的每行代码,而是看着AI在干什么——关注方向是否正确,而不是每行代码写得对不对。
Claude Opus 4.7 深度拆解:视觉能力换代,长任务执行不再掉链子
4 月 16 号,Anthropic 发布了 Claude Opus 4.7。
第一眼看过去,我也只是扫了一眼 benchmark 表格,心想大概又是例行更新。
但真正把官方公告、232 页系统卡,以及十几家合作企业的真实使用反馈全部啃完以后,我发现——这次的升级远不止常规迭代。
不是那种"比上一版强了一点"的改进,而是"某些能力直接跃迁到新层级"。
我自己使用 Claude Code 做日常开发已经超过半年,Opus 4.6 一直是主力工具。看过这次升级的全部数据和一线反馈后,我觉得有必要认真梳理一下。
本文不堆砌数据,只聚焦三个最值得你关注的核心变化,最后再聊聊谁该立刻升级,谁可以缓缓。
第一个关键变化:视觉能力不是"优化",是"代际跨越"
先说一个让我瞬间清醒的数字。
安全公司 XBOW(专注自主渗透测试)给出了一份视觉敏锐度基准测试的结果:Opus 4.6 得分 54.5%,Opus 4.7 直接跃迁至 98.5%。

XBOW 原话是:“We effectively eliminated our single biggest Opus pain point, and that unlocks its use for a whole class of work where we couldn’t use it before.”
“我们直接消灭了 Opus 最大的痛点,解锁了一整类以前根本没法用的场景。”
你细品这句话——不是"更好用了",而是"以前压根不能用的场景,现在能用了"。
再看 ScreenSpot-Pro,一套专门测试 Agent 屏幕定位能力的基准。测试方式是给模型一张 VSCode、Photoshop 这类专业软件的高分辨率截图,让它精准定位某个 UI 元素。在高分辨率下,目标元素可能只占整张图的 0.07%。
Codex Prompt 实战兵器谱:30 个高阶模板横扫软件全生命周期
为什么同样是调用 Codex,别人能用一段提示词直接落成整个模块,而你却总是在细节上反复拉扯?差距就藏在提示词的写法里。本文融合 OpenAI 官方 Codex Prompting Guide 与一线开发者的实战沉淀,系统梳理出 30 个经过高压验证的先进 Prompt 模板,覆盖从项目启动、代码审阅、缺陷排查、结构重整到部署发布的全部阶段,拿来就能用。
根基概念速通
一次好 Prompt 的四根柱子
OpenAI 官方强调,每一条高质量的 Codex 提示都应具备四个关键要素:
| 要素 | 职责 | 示意 |
|---|---|---|
| Goal(目标) | 用一句话划定你要达成的结果 | 「为用户表单追加实时校验」 |
| Context(上下文) | 给出精确的文件、目录、文档或错误信息 | 「关联文件:src/components/UserForm.tsx」 |
| Constraints(约束) | 圈定禁区与必须遵守的规范 | 「零新依赖,与现有 API 完全兼容」 |
| Done when(完成条件) | 提供判定完成的明确信号 | 「全部测试套件通过,build 零报错」 |
Codex 与 Claude Code 关键差异速览
| 维度 | Codex | Claude Code |
|---|---|---|
| 配置载入 | AGENTS.md + config.toml | CLAUDE.md + settings.json |
| 技能模块 | .agents/skills/SKILL.md | .claude/skills/*.md |
| 子代理 | .codex/agents/*.toml | Agent Team 工作模式 |
| Hook 体系 | .codex/hooks.json | .claude/settings.json |
| 规划入口 | /plan 或 Shift+Tab | /plan |
| 代码审阅 | /review | 代码审阅 Agent |
| 分支隔离 | Git Worktree | Worktree |
| 推理强度 | 可选 low / medium / high / xhigh | 自动调节,不可手动设定 |
本文阅读指南
请根据你当前面临的开发任务,在下方对应分类中定位模板,将 [方括号] 内的占位内容替换为自己的实际场景,直接粘贴进 Codex 对话即可启动。
Coze实操:1分钟自动抓取1万+条小红书评论,搭建你的爆款选题库
做自媒体的人都知道,评论区是洞察用户真实需求的重要窗口。可无论翻阅自己的笔记评论,还是挖掘对标博主的评论区,靠纯人工去一条条翻,效率实在太低,很多运营者只能眼睁睁看着那些藏在评论里的选题灵感、产品反馈慢慢流失,却根本没有精力深挖。
为了帮大家解决这个痛点,我们基于扣子(Coze)搭建了一套自动化工作流,只需一键,就能自动抓取小红书热门笔记的全部评论,并且同步写入飞书多维表格里。先来看下效果:
通过这个工作流,一次运行就能批量采集多篇笔记的评论,所有数据自动汇入飞书表格,再也不用逐页翻看。下面,我们就一步步来拆解整个搭建过程。
一、搭建自动采集小红书评论的工作流
1. 新建工作流
首先,登录扣子平台(复制链接进入):
https://www.coze.cn/space/7512405357499711528/library

进入后,点击左侧「资源库」,再选择「资源」→「工作流」,然后点击新建。

根据提示填写一个清晰的工作流名称,比如“小红书评论自动采集”。

2. 配置采集评论的核心流程
(1)设置「开始」节点
将开始节点按照下图配置即可,主要定义输入参数,后续我们会传入cookie、笔记链接列表等信息。

(2)添加「循环」节点
在开始节点之后拖入一个「循环」节点,它的作用是逐条处理我们提供的多个笔记链接,实现批量采集。
添加方式如下:

接着,设置循环节点的参数,让它遍历传入的笔记链接数组。

(3)在循环体内部依次添加4个子节点
节点1:「采集评论」插件
在循环体内插入一个“采集评论”插件节点。这一步负责调用小红书接口,根据单条笔记链接抓回对应评论数据。① 搜索并添加插件:

② 插件的参数设置如下图所示,主要是传入当前循环项的笔记链接和cookie。

节点2:「IF选择器」
在插件节点后接上一个「IF选择器」,用于过滤掉没有任何评论的笔记,避免空数据写入表格。左右滑动查看配置:


节点3:「代码」节点
在IF选择器的“否则”分支(即存在评论时)后面,添加一个「代码」节点。它的作用是对插件返回的原始数据进行清洗、格式化,整理成我们需要的字段结构。代码节点的参数如下:

节点4:「飞书多维表格」插件
最后,在代码节点之后放置一个飞书多维表格的“添加记录”插件,将处理好的评论数据逐条写入预设的表格。① 添加对应的飞书插件:

② 设置插入记录的参数,将代码节点输出的每个字段映射到飞书表格的对应列。

(4)连通结束节点
最后,将整个循环节点连接到「结束」节点,并简单设置结束的输出,比如返回“采集完成”。


这样,整套自动采集工作流就搭建完成了。接下来,我们需要准备好让它跑起来所必需的几个素材。
二、运行前的准备工作
运行工作流前,需要准备好以下四样东西:
- 小红书cookie(用于身份校验)
- 待采集的小红书笔记链接(可以是一条或多条)
- 飞书多维表格(用于存放采集结果)
- 飞书表格的链接(配置应用时使用)
1. 获取小红书cookie
用浏览器打开小红书并登录账号:https://www.xiaohongshu.com/
按F12进入开发者模式,然后按下图步骤在网络请求中找到cookie值并复制保存。

2. 准备笔记链接
直接将目标笔记的地址复制出来,可以是单条,也可以用换行或逗号分隔多条链接,在运行时会作为数组参数传入。

DeepSeek V4 开发者体验全解析:百万上下文、Agent质变与国产算力落地
1M 上下文标配、Agent 能力比肩 Opus、国产算力加持——DeepSeek 这一次不只是在追赶,而是在重新定义「开源模型的天花板」。
先说结论
今天上午,DeepSeek 官方正式发布了 DeepSeek-V4 预览版,同步开源。这不是一次小版本迭代,而是一次从架构到能力的全面跃迁。
简单说三件事:
- 百万上下文成为标配——不是噱头,是实实在在的工程突破
- Agent 能力质变——从「能对话」到「能干活」,直接对标 Claude Opus 4.6
- 国产算力落地——昇腾、寒武纪 Day 0 适配,这不是 PPT,是今天就能跑的东西

DeepSeek-V4 双版本
一、百万上下文:不是加个滑窗那么简单
这次 V4 最抓眼球的数据是 1M(一百万)Token 上下文,最大输出 384K Token。但如果你以为这只是「把 KV Cache 塞大一点」,那就低估 DeepSeek 了。
架构层面的革新
根据技术报告,V4 搞了一套全新的注意力架构,核心是两个东西:
- CSA(Compressed Sparse Attention):在 Token 维度做压缩,不是存所有 KV,而是只保留关键信息
- HCA(Highly Compressed Attention):对历史信息做极度压缩,保留语义骨架
这让我想到一个类比:传统注意力像「逐字逐句记笔记」,CSA+HCA 像「读完一章写一段摘要,再从摘要里提取关键点」。信息有损,但损失的是冗余,不是核心。
上下文效率对比
数据很硬核:和 V3 相比,推理 FLOPs 降低 73%,KV Cache 大小减少 90%。这意味着不是靠堆硬件撑上去的,而是靠算法优化把效率拉上来的。一百万上下文不再是实验室里几张 A100 堆出来的数字,而是一种可以普惠到每个开发者的能力。
我的看法
百万上下文的意义不在于「我能不能一次塞进去一整本书」,而在于它改变了开发者和 AI 协作的方式。
举个例子:我之前用 Claude Code 做项目,200K 上下文已经可以理解整个中型项目了。但如果 V4 真能稳定跑在 1M 上下文,那意味着:
Hermes Agent 新手安装完全指南:永久记忆与自动技能生成,打造越用越懂你的AI助手
当许多人还在为 OpenClaw(龙虾)的 Token 消耗苦恼时,AI 圈又丢出一枚重磅炸弹——Hermes Agent 正式登场。名字和那个卖包的奢侈品牌一样,团队这样命名,似乎在暗示:龙虾界的爱马仕来了。
上线不到两个月 GitHub 星标突破 5 万,单日最高新增 6400 星,持续霸榜全球开源榜单第一。

Hermes Agent 为什么会这么火?一句话总结:它并非一次性对话助手,而是一个越用越像你、越用越懂你的 Agent。
它就像是进化版的龙虾,主打永久记忆和自动成长——不会忘记你教过它的任何东西,还能自己学会你的使用习惯,时间越久,契合度越高。
它能自动总结技能(skill):当你交给它一个复杂任务,执行完成后会自动沉淀提炼,生成可复用的 skill 文件。下次遇到类似问题,不必重新分析,直接调用,瞬间搞定。
Hermes 还原生支持个人微信:私聊群聊都能用,信息全覆蓋。当然,飞书、钉钉、企微这些主流平台也同样支持。
接下来,我将一次性为你讲清楚:Hermes Agent 凭什么火、怎么安装、适合哪些场景。
01
Hermes Agent 为何突然爆火?三大核心功能揭秘
用过 OpenClaw(俗称龙虾)的朋友都知道,这玩意真的很烧 Token,成本并不低,直接劝退了一波用户。
从我自己的亲身体验来看,完成相同任务,Hermes Agent 的 token 消耗大约只有 OpenClaw 的二十分之一。
不过这里要说明一点,任务的 token 消耗因人而异。有些人给 Hermes 的任务过于复杂,导致它实际也没比 OpenClaw 便宜多少。但无论具体能省多少,OpenClaw 的高成本始终是用户的痛点,毕竟不是人人都预算宽裕。
那为什么 Hermes 的 token 消耗会比 OpenClaw 低那么多呢?
关键就在于它的三个核心能力:
第一,Skill 自己长
这也是 Hermes 最值钱的地方。
整个闭环只有四步:执行任务 → 自动复盘 → 生成 Skill → 下次直接调用。
md2wechat:2100+ Star的Markdown转公众号排版利器,一键告别繁琐编辑

▌ 核心要点
md2wechat 是一款基于 Go 语言开发的命令行工具,能够将 Markdown 直接转换为符合微信公众号规范的排版样式,并自动上传到草稿箱。该项目在 GitHub 上已获得 2100+ 星标,内置 40 余种主题、43 个结构化排版模块,且可对接 Claude Code、Codex、OpenClaw 等 AI 写作助手。免费模式即可覆盖大部分需求,API 模式则提供更完整的专业能力。
初识 md2wechat:它到底解决了什么问题
如果你正在运营公众号,一定对这样的场景不陌生:在微信编辑器中反复调整两小时,换个手机预览却发现样式完全错乱。又或者,你早已习惯用 Typora / Obsidian 等工具在 Markdown 中写作,发布时却不得不把内容粘贴到编辑器里,再逐项调整格式。
md2wechat 正是为终结这类痛点而生。你只需继续保持 Markdown 写作的习惯,剩下的排版、转换、上传草稿箱全部由它接管。全过程在命令行中完成,根本无需打开浏览器。
这样一来,写作与发布之间的断层被彻底打通,创作者得以把精力重新聚焦在内容本身。
哪些人最适合它?
长期维护公众号的创作者、技术团队里负责内容输出的运营人员,以及借助 AI 辅助撰稿却被排版问题拖慢节奏的朋友,都是这款工具的理想用户。反过来,如果你只在手机上写作,或对排版完全没有个性化要求,可能并不需要专门安装一个命令行工具。
一个命令行工具,接管公众号发布全流程
安装过程非常轻量。对于 macOS 用户,一行命令即可完成:
brew install geekjourneyx/tap/md2wechat
其他平台则提供了 npm、go install、install.sh 等其他便捷安装方式。
基本工作流十分简洁:用 Markdown 写完文章,运行 md2wechat 触发转换,精美排版即刻生成,最后自动上传至微信草稿箱。全程都在终端内完成,公众号后台的编辑器无需打开。
相较于市面上其他 Markdown 转换工具,md2wechat 有一个显著优势:在 API 模式下,同一份 Markdown 总是产生完全相同的排版(确定性输出),而不是每次都依赖 AI 重新生成。这对于需要批量发布、团队协作的场景来说,显得格外关键。
43 个排版模块:像搭积木一样营造视觉层次
项目中提供了 43 个高度结构化的排版模块,你可以通过类似 :::block hero、:::block callout、:::block timeline 的语法,在 Markdown 中直接调用。想插入一个醒目的引用块?只要写一行 :::block callout,不用手动调整任何样式。
NanoBanana2 五大创新玩法实测:超宽比例生图、微缩模型、实时搜索与翻译上色全解析
就在上周,谷歌低调发布了旗下最新模型 NanoBanana 2。它一上线便登顶 Arena 文生图排行榜首。

说实话,AI 生图领域迭代太快,多数时候我已经很难再感到兴奋。但 NB2 的确有些不同——它的基座模型从 Gemini 3 Pro 换成了 Gemini 3.1 Flash,推理速度更快、成本更低,画质却几乎没有下降,而且最关键的一点是:基本不再需要反复“抽卡”。
那么,新晋生图王者到底带来了哪些改变?我简单整理了一下:

作为普通用户,NB2 又能为我们的日常创作提供哪些便利?下面我将总结出五个最新玩法,并附上提示词,同时也会介绍在没有特殊网络环境下使用 NB2 的方法。
五种全新创作玩法,一次看懂
1、一键生成极宽幅图像
此次 NB2 新增了 4:1、1:4、8:1、1:8 等超宽或超窄画面比例,再加上原有的 1:1、16:9、9:16、4:3、3:4、3:2、2:3 等比例,设计场景的灵活度大幅提升。
特别是 8:1 和 1:8 这类极宽画幅,非常适合制作电商详情页 Banner、装修全景图、商场围挡、户外广告和游戏侧边背景,能带来强烈的沉浸感。
比如我生成一张太阳系主题的图片:

提示词:太阳系,比例:8:1
还能模仿《清明上河图》的画风来创作现代城市风俗图:

提示词:模仿清明上河图的风格,画一张现代的【城市】的风俗画,8:1比例,2K。
1:8 的超窄比例同样震撼。

提示词:万米深潜。画面构想:这是一场向海洋极深处的坠落。最上方是波光粼粼的海面和一艘小船;往下是游动着巨大蓝鲸;继续往下光线急剧变暗,出现沉船和发光水母;到了画面的最底部,是一个几乎占据整个屏幕宽度的、潜伏在海沟里的不可名状的克苏鲁巨兽张开的深渊巨口,而上方正有一个极小的潜水员在缓缓下落。比例1:8
2、生成微缩模型
NB2 只需简单的提示词就能生成细节丰富的微缩模型效果。比如我用广州地标做一个建筑模型:

提示词:一张广州的街景地图放置在木质桌面上,地图上浮现出广州的逼真微缩模型,以及广州塔(小蛮腰)、石室圣心大教堂、陈家祠、白云山与绿植、熙熙攘攘的街头集市、复古有轨电车和天空中漂浮的彩色灯笼。
再用上海外滩做一座 3D 微缩城市:

提示词:上海外滩 3D 等距微缩城市景观,采用微缩移轴摄影风格,高度还原东方明珠塔等建筑细节,运用柔和的影棚灯光、黏土和树脂材料,并在城市中心融入大型 3D 风格化汉字“外滩”。
3、实时搜索生图
NB2 新加入了搜索功能,可以实时从互联网获取知识和参考图来生成图像。比如我让它根据未来五天广州的天气帮我搭配衣服:

提示词:根据未来五日广州的天气给我搭配衣服,生成一张图片。
还可以直接输入:介绍一下 Nano Banana 2 图像生成模型的核心亮点
NAS 自建音乐服务器终极方案:GoMusicDL 多平台一键部署与批量下载指南
想要搭建属于自己的 NAS 音乐服务器,第一步往往就让人头疼——音乐资源从哪里来?即使开通了 QQ 音乐、网易云等会员,下载歌曲仍有每月数量上限,或者下载到的文件是加密格式,难以自由管理。如果你也卡在这一关,那么本期介绍的 GoMusicDL 很可能成为你的完美解法。它支持 Docker Web 部署、桌面应用、TUI 终端三种模式,定位远不止是“资源获取工具”,简单配置后,还可以直接当作一个轻量级 Web 播放器使用。

桌面应用目前覆盖 Windows (x64/x86/arm64)、macOS (x64/arm64)、Linux (x64),大家可以直接前往项目发布页面获取对应版本。

项目概述
完整项目名称为 guohuiyuan/go-music-dl,可以在 GitHub 上直接搜索。GoMusicDL 是一款集搜索与下载于一体的音乐工具,同时提供 Web 界面、TUI 终端和桌面应用三种使用形态。除了常规的单曲搜索与下载外,它还支持歌单解析、专辑解析、整单/整专曲目查看与批量处理。你可以通过浏览器在线试听,也能在终端里批量下载,或者直接启动原生桌面应用,获取最佳体验。
核心亮点
- · 三种使用形态:不止于命令行,支持 Web、TUI 和桌面应用,按需选择。
- · 不止单曲:支持单曲、歌单、专辑的搜索、解析和批量下载,且下载文件已内嵌元数据。
- · 多平台聚合:聚合多平台搜索能力,支持试听、歌词、封面以及灵活换源。
- · Web 端功能齐全:包含本地收藏夹、自建歌单、批量下载/换源、全局播放栏,完全可以当作日常播放器使用。

Docker 部署指南(以威联通 NAS 为例)
这里以威联通 NAS 环境为例,采用 Docker Compose 的方式进行部署,操作简单且易于维护。
部署参考代码:
services:
music-dl:
image: guohuiyuan/go-music-dl:latest
container_name: music-dl
restart: always
user: "0:0"
ports:
- "9981:8080" # 左侧端口可按需修改
volumes:
- /share/Container/musicdl/data:/home/appuser/data # 配置目录,左侧映射路径可自行调整
- /share/Music:/app/downloads # 音乐存储目录,左侧路径可自行调整
environment:
- TZ=Asia/Shanghai
command: [ "./music-dl", "web", "--port", "8080", "--no-browser" ]
在威联通的 Container Station 中,直接创建新的应用程序并粘贴以上配置即可。
NAS一键部署AI狼人杀:纯前端智能桌游,与9名AI角色烧脑对决
临近五一假期,为你推荐一款能独自解闷、也可与亲友同乐的趣味项目——AI狼人杀。每个角色背后都由不同的大语言模型驱动,拥有专属的性格和策略,能够根据场上局势推理、发言、投票,甚至编织谎言,让每一局都充满戏剧性。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀1.webp)
项目简介
完整项目名为onebai123/wolfcha-web,可在GitHub上搜索获取。
该项目是Wolfcha(猹杀)的二开版本,基于oil-oil/wolfcha改造而来,是一套纯前端实现的AI狼人杀游戏。它支持自定义API端点,仅需一个网页,所有人都能直接参与。
你将作为全场唯一的人类玩家,与其他9名AI角色共同经历一局完整的狼人杀。不同的AI不仅性格各异,其背后的博弈策略也千姿百态:它们会依据当前局势展开推理、发表言论、互投选票,甚至故意说谎。
作者在项目页面透露,未来会推出v2.0版本的无后台联机模式,基于Redis或对象存储实现房间同步,让多人远程对战成为可能,且依旧无须自建后端服务器。
产品亮点
- 🌐 纯前端运行:不依赖后端,一个网页即开即用
- 💾 本地存储:API Key仅保存在你的浏览器中,保障数据安全
- 🎮 零门槛开玩:无需注册账号,打开页面直接开始对局
- ✅ 灵活接入API:支持DeepSeek、硅基流动、OpenAI等任意兼容接口
- 📱 多设备适配:电脑、平板、手机均可流畅游玩
- 🔏 隐私至上:所有数据只存放在你本地的浏览器内
部署方式
以威联通NAS为例,使用Docker Compose来快速部署。由于原项目未提供现成镜像,我已自行构建并发布到了Docker Hub。
你可以使用下面的配置进行部署:
services:
wolfcha-web:
image: ydxian/wolfcha-web:v1
container_name: wolfcha-web
ports:
- "7860:7860"
restart: always
进入威联通的Container Station,创建一个新的应用程序,将上述内容粘贴保存即可。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀2.webp)
游戏初体验
部署完成后,在浏览器访问NAS_IP:7860,就能见到极具仪式感的主页:“签署名字后才可生效”。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀3.webp)
点击右上角的「设置」,你可以调整难度、玩家人数以及声音效果等参数。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀4.webp)
不同人数配置下的角色组成也各不相同,策略空间随之变化。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀5.webp)
以硅基流动为例,在设置页面填入你的API Key与模型名称,保存即可。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀6.webp)
保存后刷新页面,轻触指纹处的签名区域,游戏便正式开始。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀7.webp)
接着会进入等待其他“玩家”入场的环节。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀8.webp)
看,我抽到了女巫!
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀9.webp)
游戏还贴心地为新手准备了一些引导提示。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀10.webp)
即使使用的是免费的公开API,响应速度也丝毫不拖沓,节奏紧凑。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀11.webp) https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀12.webp)
另一个有趣的细节是,每位参与者的性格标签和背后调用的AI大模型都不完全相同,这极大增强了对局的多样性和娱乐性。
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀13.webp)
https://watermelonwater.tech/insights_imgs/NAS一键部署AI狼人杀14.webp)
结语
如果你也对这款纯前端的AI狼人杀感兴趣,不妨先部署体验起来,同时期待作者早日带来支持多人联机的v2.0版本。
