Insights

AI Agent 时代的工程范式革命：解读 Harness Engineering 的马、马具与骑手

2026 年 2 月，“Harness Engineering”这个术语突然在 AI 工程圈内引爆了话题。Mitchell Hashimoto 在个人博客里率先提出这一概念，紧接着 OpenAI 发布了涵盖百万行代码的实验报告，Martin Fowler 也紧随其后撰写了深度分析文章——仅仅几周时间，这一概念便成为讨论 AI Agent 开发时无法绕开的焦点。

一、核心隐喻：驾驭野马——马、马具与骑手

要理解什么是 Harness Engineering，目前业界最广为流传的隐喻是：

马（The Horse - AI 模型）：当下的 AI 模型（如 OpenAI Codex 等）犹如一匹力大无穷、疾驰如风的骏马。它的能力让人惊叹，但若不加引导，它常常彷徨不知方向，甚至横冲直撞（即产生幻觉、偏离架构规范）。
马具/缰绳（The Harness - 基础设施）：涵盖约束规则、护栏机制、上下文传递路径以及反馈循环。它们将 AI 模型的原始“智力”塑造为能够达成特定业务目标的系统。
骑手（The Rider - 人类工程师）：工程师不再需要“亲自奔跑”（手写底层代码），而是紧握缰绳，指明方向，注入意图并提供结构化反馈。

二、为何 Harness Engineering 不可或缺？

在过去两年中，行业共同发现了一个痛点：对 AI Agent 而言，“再努力一点（Try harder）”这条路根本走不通。 当 Agent 在庞大的代码库里迷失、陷入死循环、或者编写出违背公司架构规范的设计时，仅仅依靠调整 Prompt（提示词工程）来挽救局面极其脆弱。

Harness Engineering 应运而生，正是为了突破 AI 自主性的瓶颈。它的核心思想是：每当 AI 犯错，不要耗费精力去调整玄学般的提示词，而是改进 Harness 系统（例如添加一项 Linter 或测试拦截器），让它在机制层面再也不可能犯同样的错误。

模型能力并非瓶颈所在

这一论断已经得到了量化实验的支撑：

Can.ac 实验：仅仅改变 Harness 的工具格式（编辑接口），就在 16 个模型上显著提高了编码基准分数。效果最引人注目的是 Grok Code Fast 1，其成绩从 6.7% 飙升至 68.3%——完全没有任何模型权重的改动。

Insights

AI 编程工作流完全指南：从需求到上线的 Vibecoding 高效秘诀

大语言模型最核心的能力依然是编程，其它的表现更像附加天赋。既然我们“聘请”了这位程序员，那就应该让它发挥擅长，而不是浅尝辄止。

曾经有一种论调称，如果没有任何编程基础，就无法有效驱动大模型写代码。但我偏不信这个邪，也坚持认为这项技能不仅自己要学会，更要分享给所有渴望掌握 AI 编程的人。

随着 AI 能力的渗透，软件开发的壁垒正在瓦解，独立搭建应用的门槛将下沉到每一家企业和每一个团队。未来当老板冒出数字化需求时，他会直接让你用 AI 捣鼓出一个工具，而不再是丢给外包。谁先驾轻就熟，谁就能率先在组织里构建起不可替代的竞争力。

AI 编程应该怎么学

其实最难的部分——写代码——大模型已经替你做了。剩下的核心，是建立起对整个软件开发生命周期的认知与掌控。

传统开发通常分成五个阶段：需求梳理、UI 设计、前后端开发、测试、上线。引入 AI 之后，流程可以精简为四步：需求梳理、软件开发、体验测试、部署上线。UI 设计这一步被融入开发过程里，而且每个环节都有 AI 协同，复杂度显著降低。

需求梳理

接到需求后，首先要厘清这个软件要解决什么问题、以什么形态呈现。脑中有了大致轮廓，就可以借助 AI 工具的 Plan 模式，生成一份完整的开发计划。这中间需要不断与模型沟通、迭代，把模糊的想法打磨成可执行的路径。

经验提示 推荐一套配合 Plan 模式使用的 skill 组，它能主动向你提出大量追问，最终自动生成需求调研报告和功能清单，帮助你从各个维度把需求细化到可落地的颗粒度。

Github：https://github.com/zhengyunhui123-dev/cursor-claude/tree/main/PM-skill

软件开发

接下来，将计划文档、需求调研报告和功能清单一起交给 Codex、Claude Code、Workbuddy 等 AI 编程工具，让它们执行开发。过程中前端开发可以调用 frontend-design 这个 skill，至少能保证产出的界面美观可用。

实践心得

先构建最小可行产品（MVP），再逐步叠加功能。不要一开始就规划大而全的方案，因为初期对需求的理解往往不够完整，如果让模型一次性生成庞大代码，后续要调整时，连你自己都很难组织语言告诉它改哪里。
根据软件类型，尽早决定使用本地数据库还是线上数据库。需要本地数据库时要搭配 Docker 辅助开发；线上数据库推荐 Supabase，上手快且生态完整。

（Docker、Supabase、Github、Vercel 等工具的具体使用教程会在后续分享。）

不要执着于只用某一个 AI 工具。个人常用的策略是：让 Codex 负责写代码，同时在豆包、元宝等免费产品里为这个项目创建独立的对话。遇到不懂的问题就问它们，需要自己手动操作时，让它们一步步指导。这样既不会污染主工具的上下文，也不会浪费高级模型的宝贵 token，效率很高。

体验测试

在传统流程中，这部分通常是产品经理反复“走流程”来验证开发结果。AI 完成编程后，软件会先在本地运行起来。你要做的就是逐项体验、测试，把不符合需求的地方“圈”出来，再打回给模型修改，直到满意为止。

这一环节往往最耗时间，因为 AI 交付给你的更像一个“简装房”，需要你进行细致的“精修”。

精修管理

“精修”主要包含需求变更和 Bug 修复两类。建议把这两类问题都记录成台账，方便后期追踪。这个项目管理的方法也写进了 AGENTS.md 文件中，里面还融入了社区大牛总结的编程规范以及补充要求。放在项目文件夹里，AI 编程时会自动读取并遵循。

Insights

AI编程零基础部署全攻略：从GitHub到Vercel，手把手用域名上线你的Web应用

这篇文章是一个从未接触过编程的我，在一步步查阅资料、询问AI之后，耗费两天时间，终于将自己用AI编程打造的一款记账软件成功部署上线的真实记录。

整个过程踩坑无数，走了不少弯路，也浪费了许多时间。

因为部署流程的步骤较为繁琐，我把整个过程详细记录下来，既是为了与大家共同进步，也是为了日后自己需要时能够快速回顾。

前提

最近我用 Codex 编写了一个小巧的软件，取名为 jotbook。

它本质上是一个记账工具，用来记录我每天的支出，所有内容都保存在本地。无需登录，没有数据库，也不依赖后端。

网上建议使用 PWA 架构，说是体验贴近原生应用，部署起来也方便简洁，我便让 Codex 也照此实现。

在本地调试一切正常后，剩下的工作就是将它部署上线，这样我就能在手机上随时随地使用了。

我之前考虑过直接使用本地调试的版本来记账，但实际操作起来并不方便，需要电脑一直开机，并且保持服务持续运行。

所以，最终还是决定将它部署上线。

部署上线

部署上线过程可以总结为以下三步：

将项目上传到 GitHub
通过 Vercel 进行部署上线
配置域名解析

虽然看上去只有三步，但每一步都埋着大大小小的坑。我也是尝试了多种方案后，最终选择在 Vercel 上部署，目前看来这是最方便的一种方式。

如果你手头没有现成的项目，可以直接复制我的这个项目（https://github.com/zhengyunhui123-dev/jot），按照教程走一遍完整的部署流程。

上传 GitHub

编程离不开 Git，这是毋庸置疑的。

Git 的核心作用是版本管理，假如你从来不进行版本管理，一旦代码改崩了，就会让你体验到什么叫做痛苦。

GitHub 则是将你的代码存储在云端的地方，把代码上传到 GitHub，主要是为了方便下一步 Vercel 的部署。

Git 使用

Git 基本大家都安装过，使用 Claude Code 本身就要求必须安装 Git。如果你懒得记那些命令，可以下载一个图形化工具——“小乌龟”（TortoiseGit）。

毕竟每次让大模型帮你操作 Git，消耗的都是白花花的 token，还容易污染上下文，不如自己手动搞定。

这也是我建议手动提交的原因之一。

Git 分为提交（commit）和推送（push），提交是提交到本地仓库，推送才是同步到 GitHub 上。只有推送成功，代码才能同步给 Vercel。

在执行 Git 提交时，尤其要注意下面两点：

敏感信息不要提交，比如你的密钥、账号密码等，不要稀里糊涂地全选提交，务必先筛选剔除敏感内容后再提交。
本地依赖不要提交，也就是那个叫 “node_modules” 的文件夹，如果提交了，在 Vercel 部署时就会报错。把它从提交中剔除出去。

这也是我建议手动提交的原因之二。

Git 的其他详细使用方法，可以去询问元宝或豆包。

Insights

AI变革前景未明，现在跳槽真的合适吗？

身处互联网行业的从业者，想必都感受到了，今年整体的业务推进相当困难。

尤其在ToB赛道，各大企业的需求都在收缩，新项目基本不会启动。即便偶尔出现一两个机会，报价也被压得极低，而且就算价格再低，也很难轮到你的公司来接单。

这就引发了一系列连锁反应——像你所在的公司这类做ToB业务的互联网企业，纷纷开始“勒紧腰带过苦日子”。

有的公司状况稍好一些，选择节衣缩食，砍掉福利，下调薪资，冻结招聘，号召员工一起陪公司熬过低谷。

而有些公司实在顶不住，只能裁员断臂求生，打算先活下来再谈其他。

但相当多的企业并不愿意承认是自己业务本身出了问题，反而把一切归咎于AI带来的冲击。

经过老板们反复的宣传与灌输，我们这些打工人便慢慢信了这一套说法。

矛盾被转移了，问题依旧没有解决。

作为打工者，薪资福利缩水了，活儿却一点没少，还得承受来自公司和领导的额外压力，于是开始犹豫要不要换个环境。

对于那些有些蠢蠢欲动的职场人，我想真心劝一句：先别急，不妨再观望一阵。

因为眼下所有公司都处在转型过程中，市场的运作方式远未定型，如果贸然跳出去，很可能会变得更加难以适应。

举例来说，你是一个程序员，目前在岗的公司，工作内容与职责范围已经相对确定，工作量与薪资的匹配也已大致量化，所以你能够心态平和地上下班。

而在AI冲击之下，你若是跳去一家新公司，极可能遇到待遇不涨、但工作任务翻倍甚至更多的情况。这种巨大的反差，不是谁都能消化得了的。

看看如今的招聘网站，已经明晃晃地要求一个程序员前后端都要兼顾，关键是薪资没变，甚至比之前还低。问起来，理由就是——现在有了AI，效率提高了，这些活儿一个人就能干完。

AI成了所有公司推行降本增效的统一借口，看似无懈可击。

那实际情况是怎样的？至少就我了解到的真实场景，AI并没有真正提升效率，相反，我常常因为折腾AI耗费了大量时间，加了很多班。

起初我以为这是“磨刀不误砍柴工”，可后来发现，每换一个新的工作场景，这把“刀”就得重新磨一次，仿佛永远都没有磨完的时刻。

更关键的是，制定这些规则的领导和老板，很多人压根就没亲自用过AI。他们只是看了新闻报道，听几个相熟的老板说了类似的话，就断定实际情况就是如此。

“给一个人配上AI，他就能干三个甚至更多人的活。”

“好，那就这么定了，把AI融入我们工作流。”

“什么？很多人反对？既然老员工不愿改变，那就裁员，招新人来接受这种变化。”

这，便是当下真实的工作生态。如果我们轻易换工作，很可能只是从一个坑跳进另一个更大的坑，你将不得不面对成倍增加的任务量，却无从反对，只能欲哭无泪。

最稳妥的策略，还是“苟住”，等待局势明朗。

我预估，接下来会有一轮岗位重塑与洗牌，工作岗位也会被重新划分。可能产品经理岗位要纳入编程技能，程序员将不再区分前后端，测试工程师也得懂用户体验。

这些变化之后，关键点是工作量与薪资会逐渐稳定到一个大家都能接受的区间，而不会像现在这样，严重失衡。

我相信，作为互联网行业的从业者，大家并不排斥工作量的增加，核心是要能拿到同等的报酬。

所以，在这个阶段，为了不让自己累垮，不妨先接纳现公司施加的“压力”和“压榨”吧。毕竟在现有的公司里，你多少还有讨价还价的余地，身边也有同事跟你站在同一条战线上。

等到尘埃落定，再做下一步决定，也为时不晚。

Insights

AI工程的三次范式跃迁：Prompt、Context与Harness如何重塑大模型应用

在生成式AI突飞猛进的当下，大模型的基础推理能力已经实现了跨越式的提升。然而，行业的焦点已悄然转变——从最初惊叹于“模型有多聪明”，转而思考“怎样让大模型的能力稳定、可控、合规地嵌入真实而复杂的生产环境”。

Prompt 决定你如何发出任务指令
Context 决定模型在决策时刻能看到什么信息
Harness 决定模型在怎样的运行机制中完成任务

这三层的外延其实是逐步扩大的。

当我们的目标从“做对一道题”进化为“稳定完成一整段工作流”，系统的发力点便会自然地外移。我们会先发现优化prompt已经不够，接着意识到只补足上下文仍不足，最后不得不去直面那些更工程化的问题——运行环境、反馈回路、权限边界以及记录系统。

范式一：提示词工程（Prompt Engineering）—— 寻找与AI的“共同交流语言”

在第一阶段，探索几乎都围绕着同一个主题：如何与大模型进行“有效沟通”。人们逐渐意识到，大模型内部虽蕴含着海量知识和强大的推理能力，但这些能力并不会自动释放，必须有特定的指令结构去触发。于是，开发者开始通过精心设计的输入、引导思维链（CoT）等方式，尽可能地激发模型的原生潜力。

多数人第一次接触LLM，也正是从Prompt开始的：打开ChatGPT、DeepSeek或豆包，在对话框里敲下一句话，模型随即返回一段回答。例如输入“中国的首都是哪里”，得到“北京”。这种简单直白的交互方式催生了大量的ChatBot，其实质是将模型能力封装成一个更高效的知识库、数据库或搜索引擎。在这一阶段，AI的核心仍是“问答”——如何更准确地输出用户想要的答案。

围绕这一目标，主流方法本质上都在解决同一个问题：让模型更好地理解用户意图。因此，Prompt Engineering成为研究重点，主要包括：

通过角色设定、背景补充与行为约束，构建结构化的提示
使用 one-shot / few-shot 样例对模型进行引导
引入思维链（Chain-of-Thought）以增强推理过程的可控性
借助 ReAct 框架，让模型拥有“推理—行动—观察”的基本能力（这其实也标志着向Agent形态的初步演进）

更严格地说，Prompt Engineering不仅仅是“写一句更有效的话”，而是一个包含设计、测试、评估与迭代的系统工程，其本质在于持续优化“输入表达”。

从方法论上看，这一阶段可以视为一种“输入调优”：我们把大模型视作一位极具潜力但欠缺业务上下文的高智商员工——指令越清晰、边界越明确，输出就越接近期望结果。

然而，这种高度依赖模型原生能力的交互范式也存在天然上限：

受上下文长度限制，难以承载复杂任务；
无法接入外部知识与实时信息；
更无法从根本上消除“幻觉”带来的不确定性与业务风险。

因此，单靠Prompt，并不足以支撑更复杂、更可靠的应用形态。

范式二：上下文工程（Context Engineering）—— 为大模型外接“专属知识中枢”

模型是基于上下文窗口来工作的，prompt只是其中的一部分。当任务从“问答”走向“执行”，问题的重心便从“如何提问”迁移为“如何组织上下文”。

这里的上下文，并不只是system prompt。凡是进入模型视野、影响其下一步决策的信息，都可以算作上下文，例如：

提示词
用户输入
工具定义
工具返回的结果
历史对话记录
检索出的知识片段
长短期记忆
当前任务状态

那么怎样才能有效地组织这些信息呢？显然不是简单地机械填充进来。

2.1 RAG：破解“模型不掌握的私有知识”

私域知识（如产品文档、内部规范、历史记录）通常远超上下文窗口，无法一次性输入模型，因此需要“先检索，再生成”。

RAG的核心价值在于：让检索结果贴合任务语义，而不仅仅是字面匹配。
比如搜索“苹果”，既可能命中“5元一斤的水果”，也可能命中“8000元的手机”，但真正有用的信息取决于当前任务的语境。

一个经典笑话是：女朋友说“我要买苹果，给我转点钱”，你转了100块，心想买20斤水果绰绰有余——然而她其实想买的是手机。

RAG的发展也经历了明显的观念起伏：

曾一度流行：“RAG解决一切”
随着上下文窗口扩大、微调能力增强，又出现了“RAG已死”的声音

但在实际应用中：

企业知识问答 / 内部文档检索 / 规范辅助 → RAG仍是关键
代码仓库导航 / 精确定位问题 → Grep、Glob、日志、Git等方式更加直接有效

这背后的本质并非RAG失效，而是：
不同任务需要不同的信息获取机制

Insights

AI黑科技Hi3D：2分钟将2D图片转为3D模型，零门槛实现手办级建模与工业设计

三维建模，从我开始关注数码科技的那一天起，就一直是横亘在普通人面前的一道高墙。专业门槛之高，让许多人望而却步。

但就在周末，当我像往常一样浏览各种新涌现的AI工具时，一个令人瞠目结舌的东西闯入了我的视野。

它的强大程度，甚至让我产生了一种预感：未来手办厂商和初级建模师，或许真的要面临大规模的冲击。

我说的就是这款名为 Hi3D（全称 Hitem3D）的工具。

不知道大家过去是怎么制作 3D 模型的。以我自己的经历来看，想要得到一个真正能用的模型，往往需要在各类三维软件里花费大量时间反复打磨。如果要从零开始学习，还得啃下一部又一部晦涩难懂的教程。并不是教程本身不好，而是这些专业内容天然存在着不低的壁垒。

然而，Hi3D 的出现，彻底瓦解了我对 3D 建模的畏惧之心。

它的核心逻辑简洁到近乎粗暴。

你只需要给出一张平面的 2D 静态图片，它就可以原地将其转化为一个可以 360 度旋转、全方位把玩的 3D 模型。

为了验证它是否言过其实，我立即上手做了一番测试。

先从一个简单的案例开始，给大家一个直观的印象。

这是我在港澳旅行时随手拍摄的一张照片。

将照片上传之后，大约两分钟的时间，当结果呈现出来的那一刻，我确实被惊艳到了——它直接生成了一个细节精准、纹理极为真实的 3D 模型。

紧接着，我便将模型文件导入家里的 3D 打印机。数小时后，一座承载着旅途记忆的建筑，就变成了一件实实在在的、可以摆在桌面上的专属手办。

这种从视觉图像到物理实体的跨越实在令人兴奋。建筑上那极为复杂的轮廓、石砖的纹理，甚至是锋利的边缘，全部被清晰地保留了下来。

我查阅了一下相关资料，发现这背后是一项名为 Sparc3D 的算法。

传统的 3D 重建算法，往往需要先将三维数据压缩到二维空间，再从这些二维信息重建回三维。这个过程不可避免地会丢失大量细节。

但是 Sparc3D 并没有走这条捷径。

它基于稀疏卷积网络与 3D 变分自编码器（VAE）技术，直接从源头消除了这种转换误差，实现了输入与输出的几乎无损映射。

更令人咋舌的是，在建模效率猛增 90% 的同时，生成时间反而加快了 6.7 倍。使用最新的 V2.1 版本，两分钟就能完成一个 3D 模型。

整个过程如丝般顺滑。

再来看另一个例子。我曾经在参观三星堆时，隔着展柜玻璃拍下一张青铜人像的照片。

在 3D 重建领域，人像和复杂结构可谓是最具挑战性的硬骨头。因为我们人类的眼睛对人脸的差错极度敏锐。

我决定用这张照片继续考验它的能力。

为了让最终效果达到完美，我先借助一款 AI 生图工具，把这张照片处理成白底的等轴测视图。

指令是这样写的：

“为图片中央的物体生成一张真实的等轴测照片，物体居中，白色背景，无阴影。”

然后，我把这张白底图上传，选择他们最新的 2.1 模型，点击生成。

Insights

AI生成HTML替代PPT：告别PPT，让大模型直接输出可演示的HTML页面

最近读到一篇很有启发的文章，Claude Code 的团队成员 Thariq 分享了一个趋势：自己越来越少让 Claude Code 输出 Markdown，而是直接让它生成 HTML 页面。

他的这条推特在多个技术社区引发了大量讨论。

看完后我冒出的第一个念头是：HTML 替代 Markdown 还有待验证，但如果用它来替代 PPT，逻辑是不是更通顺一些？

其实，AI 做 PPT 一直有种说不出的尴尬。

市面上的 AI PPT 工具我几乎都试过，效果不能说没有，但也就勉强能用，关键是到最后还要收费。让它生成一份演示文稿，标题、页面、版式，甚至能看出一点点设计感，但过程里总会出现几个让人头疼的问题：

版式风格不稳定，前一页还很规整，下一页突然就“翻车”了
图片和文字动不动就挤作一团
图表显得生硬刻板，一看就是模板套出来的
想对细节进行微调，改来改去反而越来越糟糕

既然现在各大 AI 写 HTML 已经这么强，那为什么不换条路：直接生成一个 HTML 页面来演示，何必非要跟 PPT 死磕？

为什么 HTML 更适合 AI 生成

PPT 对 AI 来说其实是一个相当“扭曲”的载体。

它需要同时处理内容、排版，还要精确控制每一页的位置、字体、图片、间距。只要有一个元素没调好，整页看起来就很不协调。

HTML 就顺畅多了。

HTML 天生就是给浏览器看的，能天然处理布局、颜色、图片、表格、图表和响应式，还能用 CSS 统一控制整体风格。AI 本身就是写代码的好手，生成 HTML 比走 PPT 那条“模拟排版”的路径要直接得多。

更重要的是，HTML 未必只能是一个传统的网页。

它可以是一份演示页，是一份汇报材料，是一页页往下讲述的方案稿，也可以是一个用于现场展示的辅助页面。

简单说：

讲方案，就把它做成一长串结构清晰的页面
讲产品，就把关键界面和流程按顺序铺开
讲数据，就把图表做得一目了然
讲流程，就用流程图、卡片、时间线来说清楚

这和 PPT 的目标完全一致：用最少的文字和图形，把一件事讲明白。

Insights

AI时代的正确打开方式：把软件本地化，用Vibe Coding打造专属工具箱

当你真正拥有了AI工具，最先涌上心头的会是什么？

可能是应付手头的工作——写方案的用AI理清逻辑，产品经理靠它拖拽出原型，程序员让它优化一段代码。也可能，你打算开辟自己的小副业，写小说、搞自媒体，用AI批量生成文字、图片和视频，发到网上换点流量钱。

AI工具的爆发还催生了一个新行当：搭建skill。有人搭skill只是为了自己省事，也有人借着教人搭 skill，早早就收割了一波红利。

但在我眼里，学会vibe coding，才是握住AI的那把钥匙。

各大模型一个劲儿地升级，说到底都是在为编程铺路。看看刚更新的opus 4.7，搞创作的那拨人用了一圈，纷纷又退回4.6，因为4.7把那些“他们认为没价值的写作领域”几乎砍干净了，全力转向编程赛道。

所以，我们得跟上那些最聪明的人的脚步，扎进那个充满可能性的编程世界，去体感vibe coding。

vibe coding刚火的时候，人人都摩拳擦掌，恨不得立刻把脑子里的idea变现。租云服务器，买域名，有人甚至连公司都注册好了，可最终做出来的东西，根本无人问津。

接着，网络上冒出大片唱衰的声音，社群里的vibe coding热度也很快就凉了半截。

可直到今天，我仍然相信vibe coding是对的，只不过，当初大家都想错了方向：不该先把目光盯在给别人用，而要先给自己用。

昨天看了Tim的视频，他分享了他们公司用AI改造工作流的案例，有一个细节一下子击中我——他们自己搭了一个运维数据看板。

我本身做自媒体，手里好几个账号，每个账号下都有基础的数据分析看板。真想用些专业工具，只能去花钱开通那些第三方数据平台。

可我们手上有数据，又有“技术”，为什么不干脆手搓一个自己的数据看板呢？想展示哪个维度，就拖哪个维度，完全私人订制，何乐而不为？

于是我打开Codex，搭出了自己的第一版公众号与小红书数据看板v1.0。

别说，成品还真像那么回事。亲眼看着自己从零搭建的东西跑起来，那种成就感，真的很踏实。

顺着这个思路往下想，我突然发现，还有一大串软件排着队等我去实现。

马上要考软考了，那些免费APP上所谓的题库，在我看来就跟垃圾差不多。我打算直接用AI，按照自己的出题思路，vibe出几套高质量考题，最好再做成手机端页面，这样上下班路上就能随时刷。

还有我一直用的那个记账APP，每次打开硬控我五秒广告，而且数据全都存在别人服务器上，心里实在不踏实。不如干脆自己手撸一个记账本，只给自己用，数据安安静静躺在本地，哪哪都方便。

我甚至还可以给自己搭一个个人网站，把写的Codex教程和其他各类教程一股脑都放上去。这样工具一更新或改版，我也能随时维护，分享起来也只剩下一条命令——推到GitHub上，谁想学就直接访问，拿到的永远是最新版本。

总之，值得本地化的东西，远比想象中更多。只要抱着“先为自己服务”的心态去vibe coding，就有做不完的事情，每件事都能实实在在地让工作和生活顺滑不少。

这，才是AI真正揉进我们日常的模样。

当然，如果你做出的软件自己用着觉得足够丝滑，也恰好戳中了很多人的共同痛点，不妨大方分享出来，让大家也借你东风，一起用起来。

Insights

AI试衣模特定制指南：低成本打造高质量电商穿搭素材

在服装跨境电商的激烈竞争中，快速输出差异化产品素材、构建特色鲜明的视觉推广，已成为不可或缺的核心能力。本文聚焦AI试衣与模特定制功能，为电商商家和个人创业者提供低成本、高效率的解决方案，助您轻松生成高质量的试穿效果图和动态视频，显著提升运营效率，解锁更多商业可能性。

当前电商行业的技术创新正不断帮助商家降低投入、放大产出。对于服装配饰领域的从业者而言，AI试衣+模特定制是一项颠覆性的工具，能够一键生成高品质的穿衣效果图和时尚短片。下文将详细介绍如何运用可灵AI试衣功能，助您在电商赛道中占据竞争优势。

一、前期准备

在使用可灵AI试衣功能前，请确认做好以下准备：

访问可灵网页版。
准备需要上传的服装图片和模特照片。

二、操作流程

1. 进入可灵网页版

启动浏览器，打开可灵官方网站。在首页找到“AI试衣”功能入口并点击进入。

2. 上传服装图片

在AI试衣功能界面，您会看到上传服装的选项：

点击“上传衣物图片”按钮，挑选需要展示的服装图片。
请注意，上传的衣物图片背景应尽量简洁清晰，可预先通过AI抠图工具去除背景，并避免使用已穿在人身上的照片。
您既可以选择上传单件服装，也可以上传上下装、裙子套装等多件组合搭配。

3. 挑选或自定义模特

接下来，需确定展示服装的模特：

可灵提供多种不同风格的预设模特供直接选用。
如果更想使用专属模特形象，点击“自定义模特”选项，上传自己的模特照片。此功能非常适合商家，可将自身产品模特照一键上传，即获得统一风格的效果图。（上传时请参照模特图规则）

4. 生成试穿效果

完成服装与模特上传后，点击“生成效果图”按钮：

系统会自动将服装与模特图片融合，短短几秒便能输出高质量的试穿效果图。
如有需要，系统还可依据需求生成动态视频展示。您可以自定义视频中模特的姿态动作，以适配不同展示场景。生成的效果图还可进一步进行扩图、垫图、输出视频等操作。

5. 下载与分享

生成的效果图和视频完成后，您可直接下载或进行分享：

点击“下载”按钮，将生成的内容保存到本地设备。
您也可通过社交媒体或电商平台直接分享，吸引更多潜在客户。
下方为使用某88平台产品白底图生成的效果图，可以直观感受到最终呈现十分出色。

三、实用技巧

优化素材质量
确保上传的服装和模特图片具备高分辨率、背景干净，以获取最佳生成效果。
多元场景应用
善用生成的效果图和视频开展跨界合作、季节性营销等活动，提升消费者的购物体验。
保持内容鲜活
根据市场趋势和季节更替，定期更新所用的模特造型与服装款式，持续维持内容的吸引力。

四、结语

可灵AI试衣功能为电商商家与个人创业者开辟了一条成本友好、效率显著的创作路径，让高质量试穿效果图和视频的制作变得轻松快捷。依照上述步骤，您能迅速掌握这项强大工具，切实提升电商运营水平，解锁更多增长机会。不妨现在就去体验可灵AI试衣，感受它带来的便捷与革新吧。

Insights

AI提示词入门终极指南：从零学会高效Prompt写作，避开常见陷阱

你是否也经历过这样的挫败——别人用AI几分钟就能搞定的事，你却磨了半天，出来的效果始终差强人意。问题多半不出在工具本身，而是你最初对AI说的那句话。

这就是提示词工程（Prompt Engineering）。曾有一段时间，它是一门显学，GitHub上分享提示词的人和不遗余力推广技能的人一样多。如今大模型变得聪明许多，即便没有那种雕琢到极致的提示词，也能产出像样的结果，热潮自然稍退。

但会用提示词，依然至关重要。可以说，提示词决定了你的使用上限。同样的工作，善用提示词的人一遍就能完成，不擅长的则需要反复对话才能到达同一终点，一来一回间消耗了大量token。

对于刚刚踏入AI世界的新手，虽然不必再像前辈那样苦苦钻研提示词的每一个毛孔，但基本功绝不能丢。

这篇文章将彻底讲明白：提示词究竟是什么、怎么写出高效指令、哪些坑必须绕开。

揭开提示词的面纱：它真的是AI对话的钥匙吗？

提示词，也就是prompt，本质上就是你跟AI说的那句话。

但这句话可深可浅。浅的，一句“帮我写个请假条”就完事；深的，可以是一段几百字的详细指令，把AI的角色、背景、输出格式、注意事项全部框定清楚。

打个比方：提示词就像你给新来的实习生布置任务。你说“把那个东西弄一下”，对方只会一脸茫然；如果你说“把上个月的客户反馈整理成表格，按问题类型分类，每类注明出现次数，今天下班前发我邮箱”，实习生立刻就有了方向。

AI也是如此——你说得越清晰，它做得越漂亮。

有一点需要点破：很多人误以为提示词写得越长越好，其实不然。关键在于“说到点子上”。十句漫无边际的废话，不如一句精准的要求。接下来，我会告诉你如何实现这种精准。

提示词写作的万能公式

写提示词有一个基本框架，适合绝大多数开篇场景：

设定角色 + 交代背景 + 明确要求 + 指定格式

设定角色：赋予AI一个身份

你是一名拥有10年经验的产品经理
你是一位小学语文老师
你是一个资深前端工程师

一旦赋予角色，AI就有了“人设”，输出的内容和语气都会贴合这个身份。比如你让它以“产品经理”的身份分析需求，它就会从用户价值、商业价值的角度思考，而不是搬出一串代码。

交代背景：让AI理解上下文

我正在准备一份给老板的季度汇报
这是一个面向小白的编程入门教程
我之前试过直接让AI生成全文，效果很差

背景信息越具体，AI越不容易跑偏。尤其是你曾经踩过的坑，一定要告诉AI，否则它可能重蹈覆辙。

明确要求：告诉AI该做什么、不能做什么

只分析原因，不要给解决方案
必须包含具体的代码示例
不要使用“赋能”“降本增效”这类AI腔的词

“不能做什么”往往比“要做什么”更重要。AI默认倾向于“面面俱到”，经常给你塞一堆根本不想要的东西。提前划清边界，它就知道收敛了。

指定格式：让输出井井有条

用表格呈现
每条不超过50字
分三个部分：问题、原因、建议

这一项最容易被忽视，但效果立竿见影。同样一份分析，“用表格输出”和“随便写写”在可读性上简直天壤之别。

把上面这套记在心里就好，不需要死记硬背。写得多了自然成为肌肉记忆。

实战模板：拿来即用的提示词模板

理清基本套路后，来看看几个最常用的场景。我直接提供模板，稍作改动就能用。

文案创作：如何写出有灵魂的文章

你是一个公众号作者，文风口语化、接地气，喜欢用生活化的比喻。
我需要写一篇关于[主题]的文章，面向[读者群体]。
要求：
永远不要出现“不是……而是……”的结构；
永远不要出现破折号；
永远不要结构化输出；
尽量减少标题和列表的输出样式；
尽量减少表情符号的使用。
在大部分情境下，减少使用夸张词汇，减少使用比喻、隐喻（几乎禁止使用比喻），减少使用引号，减少需要使用引号的词汇，语言风格自然平实客观。
格式：1000字左右，分3～4个小节。

个人习惯：我写文章的提示词总会把“不要怎么写”列出来，因为AI默认的写法太“正确”了，正确到没有个性。把讨厌的写法列成禁令，出来的东西会鲜活许多。

解释复杂问题：分层回答，让小白和专家都满意

请帮我解释一下【你的问题】。
请用两种方式进行回答：
1. 初学者版本：面向对象是村口的二大爷，用二大爷也能听得懂的话语为他进行详细解释。
2. 深度专业版本：面向对象是专业人群，绝不能出现事实错误。

小技巧：加上一句“使用苏格拉底提问方式”，AI就会不断追问你的问题，直到完全理解。

梳理思路：用苏格拉底提问法引导AI

【你的问题/需求】
请你回答前先问我问题。要求：用苏格拉底提问。并且根据我的回答，继续追问。直到你有95%的信心理解我的真实需求和目标，然后才给出方案。

个人习惯：我回答时不会逐条应对提问，而是想到什么就说什么，这样效果反而更好。

创意激发：让AI化身顶尖专家辅助头脑风暴

我想探讨【领域】里的【问题类型/场景】。
先别回答。请你先选一位最适合的领域顶尖名人专家来思考它。可以是活人或历史人物，名字可以小众，但必须在该细分领域很专业。如果你不确定该选谁，可以先反问我2个定位问题再选。
先输出：
1. 你选谁，他对应的细分领域
2. 为啥选他，三句话
然后再让我描述详细的问题。

这是一种更特别的理思路办法，某些情况下相当有用。