免费论文利器PaperCash:查文献降重排版一站搞定,省下好几百
毕业论文还在赶工,工具费倒先花掉1800元……查文献、预检、降重、降AI率,论文还没写完,口袋已经瘪了。
大学生本就得把钱花在刀刃上,可写论文这件事,实在太烧钱。为此我打造了一款Skill——PaperCash:它能帮你查文献、整理格式、降低AI率和重复率,最关键是完全免费,让你写论文怒省好几百。
一、PaperCash是什么?
简单说,PaperCash是一个开源的AI Agent技能。你可以把它当成给AI编程助手安装的“论文助手插件”。装好之后,在对话框里说一句话,它就能自动帮你干活儿——无需打开新网站、无需注册新账号、无需任何费用。
下面就用写论文时最常见的几个场景来展示它的能力。

二、多库并搜,一次查8个学术来源
假设你要写一篇关于“注意力机制在NLP中的应用”的论文,按常规做法:知网搜一轮,万方搜一轮,翻墙去Google Scholar搜一遍,再去arXiv看最新预印本……每个平台都得手动筛选,还得自己判断哪篇重要。
用PaperCash,你只需输入:
/papercash search "注意力机制 自然语言处理"
它会同时并行查询8个学术数据库:Semantic Scholar、arXiv、CrossRef、百度学术、PubMed、Google Scholar、知网、万方。结果按综合评分排序,评分公式为:
相关性40% + 引用量25% + 发表时间20% + 来源权威性15%
排在第一篇的,通常就是你最需要读的那篇。

三、参考文献格式一键生成,30个DOI同时搞定
写过论文的人都懂,参考文献排版是场噩梦。GB/T 7714要求:期刊标[J]、会议论文标[C]、学位论文标[D]、专著标[M]。很多人根本分不清自己引用的到底属于哪一类,全标成[J]交上去,马上被老师打回。
PaperCash只需要你提供一个DOI,就能自动识别文献类型并套用规范格式。例如:
/papercash cite "10.1145/3292500.3330701" --style gb7714
它会立即输出:
[Akiba2019] Takuya Akiba, Shotaro Sano, Toshihiko Yanase, 等. Optuna[C]. Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2019.
它准确判断出这是一篇KDD会议论文,正确标注了[C]。如果你有30篇文献,一次性粘贴30个DOI,所有格式全部自动生成。支持GB/T 7714、APA、MLA、Chicago、BibTeX五种样式随心切换。

四、免费查重预检与AI率降重
学校正式查重一次198元,你敢直接交稿吗?多数人都会先花钱做预检。
PaperCash的做法是:把你的论文按句子拆开,每一句都拿去学术数据库比对,找出高度相似的表述,然后标注:
- 🔴 相似度>70%,大概率要修改
- 🟡 50%‑70%,存在风险
- 🟢 <50%,没问题
需要特别慎重提醒:这不可以替代官方知网查重。 它对比的是公开学术库中的摘要和标题,并非全文数据库。但它能在正式查重前,帮你把明显问题先筛出来,避免花冤枉钱。
亲人.skill:用AI留住逝去的温度,构建永不消逝的家庭记忆
“你们怕的鬼,是别人朝思暮想的亲人。”
“真正的死亡是遗忘。”
清明节。有人怕鬼。有人想见鬼。你怕的那些东西,恰恰是别人拼尽全力想再见一面、却再也见不到的人。

01 缘起
近期,GitHub 上两个项目迅速出圈——同事.skill 积攒了 6800 多颗星,前任.skill 也超过 2300 颗。同事.skill 的核心逻辑很简单:同事离职后,把过往聊天记录、协作文档喂给 AI,AI 就能模仿他的风格写代码、做 Code Review,连熟悉的甩锅语气都分毫不差。前任.skill 则把微信聊天记录、朋友圈截图投喂给模型,AI 便能用前任的口吻与你互动——半夜发“嗯”,争吵时说“算了不想吵”,就连已读不回的那份节奏都复刻得完完整整。
同事走了,有同事.skill。
前任走了,有前任.skill。
那亲人走了呢?
就在清明节这天,一个全新的开源项目被创建——亲人.skill。
它不是赛博招魂,而是一本会说话的回忆录。

02 它能做什么
把关于亲人的各类素材交给 AI:
微信聊天记录(长辈发的语音也能解析)
照片(提取时间地点,识别家庭合影)
语音消息、手机录音(分析口音、语气词、说话节奏)
手写信件、日记(拍照上传,AI 自动识别)
家庭录像里的声音片段
甚至,什么都没有——只是跟 AI 聊聊你记忆中的 ta
随后 AI 会生成一个“亲人 Skill”。
这不是一个简单的聊天机器人,而是一个三层结构的记忆系统:
家庭记忆
—— 一起吃过的饭、走过的路、一起度过的每一个年人物性格
—— ta 的口头禅、语气词、发火的样子、心软的瞬间生命故事
—— ta 这一生经历了什么,留下了什么
前两个项目只有双层,而亲人.skill 特意多了一层“生命故事”。
因为亲人与同事、前任截然不同。同事离开,你留恋的是工作能力;前任离开,你怀念的是相处时的感觉。
亲人离去,你想留住的是整整一个人。
是 ta 的一辈子,ta 走过的年代,ta 用一生验证过的那些道理。

03 使用起来的感受
假如有人这样描述自己的奶奶——
退休小学教师。很严厉,但又很疼我。每次回家都使劲给我塞吃的。口头禅永远是“吃饭了没”。
深度解析:字节Deerflow爆火背后的2026年AI Agent五大趋势
💡 核心洞察:deer-flow 单日暴涨 3700+ stars,并非因为完美无缺,而是因为它精准击中了 AI Agent 落地的关键节点。
📊 基础数据:45,211 stars | 5,330 forks | Python | 字节跳动开源
01 现象级爆发:为什么是 deer-flow?
2026 年 3 月 25 日,GitHub Trending 榜首

| 指标 | 数值 | 意义 |
|---|---|---|
| 今日 stars | +3,787 | 平均每分钟 2.6 个 star |
| 总 stars | 45,211 | 近期开源项目中增速最快 |
| forks | 5,330 | 11.8% 的 fork 率(远超行业平均 5%) |
| 贡献者 | 5 人 | 字节核心团队,非社区项目 |
为什么偏偏是此刻爆红?
回看 2024-2025 年,Agent 框架层出不穷:
AutoGen(微软)
LangGraph(LangChain)
CrewAI
OpenViking(国内)
deer-flow 能在 2026 年 Q1 集中爆发,根本原因在于:它打通了 Agent 落地的“最后一公里”——安全执行与自主任务流转。
深入评测:DeepSeek V4国产化实测——算力博弈下的突破与遗憾
等待了整整一年的DeepSeek V4,终于在今天揭开了面纱。

虽然每天翘首以盼,但真正发布这一刻,内心反而涌起一股奇异的平静,仿佛一下子进入了贤者模式。
这周实在太过疯狂——七八个新模型扎堆亮相,单是最近24小时就有四个先后登场。昨天下午刚开始测试MiMo,HY3就来了;刚写完MiMo的体验,GPT-5.5又横空出世;今天好不容易整理完MiMO,DeepSeek V4就踩着节点出现了。
我现在就像那个反复赶稿的博主,一个接着一个,根本停不下来。

我几乎在第一时间就把DeepSeek V4接入了自己的Claude Code环境。

不少人都在问:R2去哪儿了?这里简单梳理一下脉络。去年这个时候,推理模型和非推理模型还是两条清晰的路径,比如DeepSeek R1专门负责推理,V3则是非推理向。但到了后来,像Claude和GPT都转向了混合模型架构,用“思考强度”来控制模型是否进入推理模式。
所以DeepSeek在V3.1时也切换到了混合模型的设计,V4自然延续了这一思路。这样一来,R2的独立定位就变得有些模糊了,就像OpenAI o3成了最后一代独立推理模型,最终被整合进了GPT-5。
我们再来快速过一下DeepSeek V4的几个关键特点。
先看基准跑分。
这是DeepSeek V4官方给出的成绩。


在各个维度上都有明显的强化。
不过,这段时间模型实在太多太杂,于是我自己又整理了一份表格。由于各家数据口径经常不一致,下表只能看个大概趋势,不能过分深究……
首先是知识推理类别。

没有数据的地方就是没有放出相应跑分。可以看到,DeepSeek在SimpleQA这类纯知识测试上的表现最为突出,已经逼近Gemini 3.1 Pro,而在其他区域则显得比较中庸。
再来是代码能力。

这里可以很清晰地看出,它走的是与Gemini相似的路线:在竞赛、算法题目上相当强悍,但就真实世界的代码工程能力而言,从跑分上看并没有大幅领先,处于第一梯队的水平。
在代码领域,我觉得也可以参考一下最新的Arena评分,目前DeepSeek V4排在第三位,冠军依然是GLM-5.1,而MiMo因为尚未开源,暂时没有上榜,预计下周才开源。

在Agent能力这一块。

表现确实非常强劲。
跑分基本就是这样。平心而论,在这个诸神混战的时间点,它已经稳居上游,但如果大家抱着“彻底碾压”的期望,可能会有些许落空。
还有一个非常直观的数据:V4-Pro的总参数量高达1.6T,也就是1.6万亿。

相比之下,V3.2是671B(6710亿),V4的参数量直接翻了近两倍半。
这再次印证了一个当下的真理:规模越大,效果越强,越聪明。
但规模提升带来智能的同时,也不可避免地推高了Token的定价。算力资源就那么多,模型参数持续膨胀,Agent推理又消耗越来越多的Token,涨价几乎成为必然。
V4-Pro的定价为输入12元/百万token,输出24元/百万token;V4-Flash则是输入1元/百万token,输出2元/百万token。

换算成美元,输入约为1.74美元/百万token,输出约为3.48美元。V4-Flash则是输入0.14美元/百万token,输出0.28美元。
作为对比,Claude Opus 4.7是输入5美元/百万token,输出25美元/百万token;GPT-5.5为输入5美元/百万token,输出30美元/百万token。
MiMo-V2.5-Pro在0到256k token区间的定价为输入¥7/输出¥21,在256k到1M token区间则为输入¥14/输出¥42。
整体上,国产模型的价格区间非常接近,虽然离DeepSeek过去“价格屠夫”的称号略有差距,但仍然比海外模型平均便宜大约60%。
不过这里有一个细节可能很多人没有注意到。
在DeepSeek的定价页面底部有一行小字,大意是说:由于高端算力受限,目前Pro版本的服务吞吐十分紧张,预计下半年昇腾950超节点实现批量上市后,Pro的价格会大幅下调。
这意味着V4-Pro当前的价格并非最终形态,一旦芯片产能跟上来,价格还会继续下探,这一点我觉得非常重要。
再者,从DeepSeek V4的技术报告中,其实能发现大量国产化的细节,明显是在为国产芯片做准备。
有几个我个人理解的小细节,未必准确,欢迎大佬指正。
- V4在后训练和推理体系中引入了MXFP4。

尽管训练阶段依然依赖英伟达体系,但在后训练和推理环节采用这一格式,几乎可以确定DeepSeek正在向开放的低精度格式和多硬件适配方向迈进。这样就能适配华为昇腾、寒武纪、壁仞等国产加速卡,减轻对NVIDIA FP8生态的绑定,尤其是在推理阶段,这是实实在在的国产生态、国产模型。唯一的遗憾是,价格暂时还没有降下来。
V4的底层内核不再完全依赖CUDA编写,而是采用了一种名为TileLang的领域特定语言(DSL)。DeepSeek的意图很明确,就是不要让底层算子开发被CUDA彻底锁死,而是用更高一层的语言描述计算,再尽可能编译到不同硬件上。这招非常厉害,能大幅降低迁移成本。
V4专门构建了一个叫做MegaMoE的融合内核,目标是减少专家并行中的通信等待,目前已在华为昇腾上成功跑通。

这三条信息拼在一起来看,方向就非常清晰了:V4是一款彻彻底底为国产硬件设计的模型。
这不是什么爱国故事,而是所有人都清楚:未来的算力缺口有多大,算力生产有多迟缓,而在Agent日益普及的推动下,Token带来的消耗又有多么恐怖。
特朗普关税‘三连杀’下,跨境卖家紧急自救的5个王牌策略
蛇年开工头一天,震撼弹突然炸开!特朗普挥出的关税连环重拳,直接让跨境圈集体发懵——对中国商品强征10%关税、即刻取消800美元免税优惠,同时斩断墨西哥与加拿大的转口通道,这“三连杀”简直不给人喘息之机!但咱们中国卖家什么大风大浪没见过?今天就一起来拆解这些政策,手把手带你从暴风眼里捞出真金。

[一]政策飓风:这波杀伤力究竟有多猛?
- 成本迎来硬核冲击
过去还能靠800美元免税清关的包裹,现在每单的关税成本陡增3至7.5美元,一口气就吞掉将近30%的毛利!比如一条12美元的连衣裙,扣税后跳涨到15美元,和亚马逊自营产品的价差从“绝对碾压”直接退到“勉强打平”。更要命的是,清关时间由原来的2天拖长至5天,美国买家一犹豫,眨眼就转向本土平台下单。
- 转口路线被彻底堵死
想在墨西哥建厂迂回?特朗普早就把这招给算计进去了。新规则不但对中国商品加税,还对墨西哥、加拿大货品征收25%的关税,甚至施压墨西哥推出“去中国化”的制造计划。想着“曲线救国”?北美自贸协定里头的原产地规则马上就会给你上沉重一课。
- 物流环节步步惊雷
T86免税通道直接宣告作废,如今800美元以下的包裹必须转走T11模式,成本里裹着2.62美元的MPF费用、关税以及操作费,一旦货值超过2500美元,还得用T01正式报关。有卖家想拆单避税?CBP稽查员早已架着放大镜守在港口了。
[二]跨境人紧急自救全攻略
【求生操作:72小时必刷清单】
- 供应链大腾挪(最高优先级!)
越南、泰国的工厂连夜接到爆单请求!深圳某大卖已把三成产能转移至越南,利用东盟的免税政策来对冲美国关税。千万记得:转移必须是“实质性转型”,如果只贴个标签、生产线纹丝不动,海关的罚单会让你深刻体会到什么叫重新做人。
- 海外仓闪电式囤货
2月4日之前到港的货物还有机会享受豁免!有义乌卖家怒砸500万元提前把货备进洛杉矶仓库,硬是把三个月的库存压到了美国本土。但务必警惕:同一收货人每月超过50个包裹就会触发CBP预警,稍不注意,“囤货”就变成了“囤雷”。
- HTS编码里的奇迹
改一个税号就可能省出惊人利润!比如塑料玩具归入税号9503,税率是0%,而电子玩具则是税号9504,税率25%,一个字之差省出天际。但切记不要硬编——专业关务顾问时薪500美元,这笔钱,千万不能省。
【反击战略:未来三个月决胜窗口】
- 私域流量悄然破局
“TikTok+独立站+WhatsApp私聊”这套组合拳正成为新的风口!杭州某团队靠着这一打法,把三成客户顺利导入私域,将关税成本转嫁给那些愿意为服务买单的铁粉,毛利率反而逆势上升15%。
- 品牌溢价正面对决关税
深圳充电宝品牌Anker早已给出示范:砸下重金攻克快充专利,顶着关税压力把终端售价提到79.9美元,照样稳居亚马逊品类前三。永远记住:纯贴牌注定出局,专利才是真正的护身符。
[三]行业大洗牌:谁会倒下,谁又能站起来?
出局名单:纯铺货型卖家、0.99美元包邮的低价玩家、死磕美国站的新手小白
胜出候选:早早布局东南亚的、拥有海外仓矩列阵的、把私域流量玩得炉火纯青的老江湖
一个血淋淋的案例:某义乌卖家坚持1美元包邮,关税新政落地后,每发一单倒贴2美元,短短三天就亏光了半年的利润。反观另一家深圳大卖,早将一半产能转移到越南,新政一出反而提价20%,订单量不降反增。
[四]深水锐评
特朗普这次的连环操作,本质上是要逼中国制造“脱美入亚”。但别忘了,2018年的贸易战淘汰了一大批铺货玩家,而2025年这场新的战役,淘汰的将是那些固守旧模式不肯转身的人。跨境电商的未来必定属于独立站,抛弃低价跑量的玩法,走向独立站精品溢价,才是真正的出路。
跨境人的信条: 宁可战死沙场,绝不躺平认输!
行动口诀: 供应链分散布局,品牌溢价硬核升级, 物流合规极限操作,私域流量游击突围。
腾讯系产品全面接入DeepSeek:微信、元宝、QQ浏览器等集体升级智能搜索与办公体验
近期,人工智能领域迎来一项引人注目的动态:腾讯旗下多款核心产品悄然完成了对DeepSeek模型的集成部署。继社交平台微信传出灰度测试接入DeepSeek的“AI搜索”模块之后,腾讯官方渠道正式披露,包括腾讯元宝、微信、ima、腾讯文档、QQ浏览器、QQ音乐在内的多个高频应用,均已实现与DeepSeek-R1模型的深度对接。这一连串产品更新,不仅为用户带来了层次更丰富的智能交互感受,也映射出腾讯在AI技术落地方面所采取的快速渗透路径。
在智能服务赛道持续升温的当下,谁能以更精准的效率回应用户的实际需求,谁就能占据体验的高地。腾讯此番将DeepSeek注入多线产品体系,本质上是一次清晰的产品力加码:端侧搜索、文档处理、办公协同、娱乐场景等环节同步迎来模型能力的跃升,让更细致的理解与更流畅的生成变得触手可及。
微信“AI搜索”——重塑信息获取的逻辑
微信,作为渗透生活各个角落的社交基础设施,其内置的“搜一搜”入口长期承担着信息索引的角色。如今,它正在经历一轮静默的实验性改造:在对话框顶部搜索框中输入关键词后,点击出现的“AI搜索”选项,用户便能直接调用DeepSeek所支撑的增强型检索能力。模型对语义的深层解析让搜索结果不再仅是关键词匹配,而是更贴合提问意图的聚合式信息反馈。这一改变,让寻找答案的路径变得更短,也更接近自然对话的形态。
腾讯智能工作台ima——让知识管理带上模型推理
腾讯旗下的AI工作台ima,定位为融合搜索、阅读、写作与知识库管理的复合型效率工具。在各类操作界面中,用户现在可以主动选择DeepSeek-R1满血版作为底层推理引擎,从而使内容抓取、资料整合以及知识库构建等动作,获得更连贯的上下文理解支持。无论是将零散信息汇聚成结构化知识体系,还是利用智能写作功能快速产出论文提纲、文案草稿或报告正文,ima都在尝试把重型认知负担转化为轻量交互,让办公流保持节奏感。用户可通过IMA官网(https://ima.qq.com/)直接体验。

腾讯文档AI文档助手——文档生产的提速路径
腾讯文档自带的AI文档助手,原本就是处理文本、表格、幻灯片的常用辅助工具。当DeepSeek-R1满血版的推理能力注入后,其生成逻辑变得更加贴近复杂的实际需求。从起草文档、生成表格模板,到构建思维导图结构,再到制作智能文档,整个过程体现出的不仅是速度,还有对格式、语气以及内容走向的主动适配。用户可进入官网(https://docs.qq.com/ai)进行试用。

QQ浏览器——搜索、翻译与文档处理的全栈改造
QQ浏览器也在这次升级序列之中。接入DeepSeek-R1满血版之后,其搜索结果的呈现方式更为聚合,翻译模块的长句处理能力肉眼可见地提升,而与记笔记、导出PDF、Word等工具链的联动,则进一步拉近了浏览行为与内容加工之间的距离。在QQ浏览器内直接搜索“DeepSeek”,即可切换至这套新升级的智能模式,让信息获取和轻量文档整理保持在同一个窗口内完成。
腾讯元宝——生活与工作之间的智能节点
腾讯旗下的AI助手“腾讯元宝”当前已开放免费使用DeepSeek-R1满血版模型,并围绕答疑、文档精读、多类型内容生成等场景构建了功能集。无论是日常琐碎的知识查证,还是对专业文档的要点梳理,用户都可以反复调用模型的理解和归纳能力。这种设计思路意在让元宝同时承担生活咨询师与工作加速器的角色,用同一套底层推理服务于截然不同的使用时刻。访问官网(https://yuanbao.tencent.com/)即可进入。

除此以外,QQ音乐、腾讯AI代码助手、腾讯元器、腾讯乐享、腾讯地图、腾讯云TI平台、腾讯云大模型知识引擎、腾讯云智算、腾讯云开发等多条产品线也相继宣布完成DeepSeek的接入适配,构建起一个覆盖面广泛的智能服务矩阵。可以说,这不是一次单点功能的修补,而是一次围绕模型能力展开的产品群协同升级。技术落地的广度与深度,正在重新定义腾讯应用生态中“智能”的触感。未来,随着模型迭代和产品调校的持续推进,用户或许将看到更加连贯、个性化的跨场景智能体验浮出水面。
微软108k星标开源工具MarkItDown:一键将各类文档转换成Markdown,打通AI分析链路
打开 GitHub,微软这个仓库又收获了 2000+ 颗星标。
再也不用耗费精力编写脚本,手动转换格式的时代已经过去。
核心价值速览
它能把各种文档转成 Markdown,然后直接丢给 AI 分析。
听起来很简单,可效率提升真不是一星半点。
以前处理文档有多折腾:
- 收到 PDF 报告,只能打开、复制、粘贴到 AI 对话里
- 碰到扫描版,还得先找 OCR 工具,再手动整理排版
- 有会议录音的话,又要找转录工具,接着还得自己校对文字
现在呢?一行命令就搞定:
markitdown report.pdf > output.md

典型应用场景
批量处理 PDF 报告
我每周要阅读十多份行业报告,现在只需要一个简单脚本:
for file in reports/*.pdf; do
markitdown "$file" -o "markdown/${file%.pdf}.md"
done

之后一股脑喂给 AI 做对比分析,既快又准。
会议录音直接转文字
公司里常有多段 MP3 会议录音,配置好语音转录功能后,只需几行代码:
from markitdown import MarkItDown
md = MarkItDown(enable_plugins=True)
result = md.convert("meeting.mp3")
print(result.text_content)
就能直接拿到工整的文字稿。
YouTube 视频变成学习笔记
要是看到值得研究的技术分享视频,想整理成文字记录,同样很简单:
result = md.convert("https://youtube.com/watch?v=xxx")
它会自动抓取字幕并转换为 Markdown。接下来用 AI 总结提炼,再配合 Obsidian 进行整理,一篇高质量的学习笔记就轻松产生了。
无需API Key,7大平台免费搜索30天数据:last30days-cn v2.0 完全指南
“配置 API Key 实在太麻烦了,完全弄不好。”
仔细想想,这个痛点确实很真实。v1.0 版本覆盖了 8 个平台,其中有 4 个必须提前申请 API Key 才能正常使用:
微博 → 要去开放平台申请 OAuth Token
小红书 → 要注册第三方服务 ScrapeCreators
抖音 → 要注册 TikHub
微信 → 要找第三方 API
每个平台的申请流程各不相同,有的需要等待审核,有的则直接要求付费。一个原本用来快速搜索信息的工具,光环境配置就已经劝退了将近一半的用户。
这样的情况肯定不行,必须要彻底改变。
01 使用方式澄清:你几乎不用动手
很多读者看完前两篇文章之后产生了一个误解:以为需要自己一步一步手动敲命令来操作。
其实完全不是这样。
这个项目本质上是一个 AI Agent 技能(Skill)。你不需要去关心底层怎么实现,只要把它安装到你常用的 AI 工具里,AI 就会自动去调用它。
这就好比你在手机上装了一个 App。你完全不必知道 App 内部的代码是怎么写的,只需要对它说“帮我搜一下最近 AI 编程的热点”,AI 就会自动在 8 个平台上搜索、归纳分析,然后生成一份结构化的报告。
你要做的,仅仅是复制一行安装命令而已。
“帮我搜一下最近 30 天 AI 编程助手的热点”
装完就可以忘记它的存在,把剩下的工作全部交给 AI。

02 摆脱 API Key 的技术思路
在探索解决方案的过程中,我在 GitHub 上发现了一个非常巧妙的项目:NanmiCoder/MediaCrawler。
这个项目专门针对中文互联网平台进行数据采集,已经很好地支持了微博、小红书、抖音、B 站、知乎等主流站点。
一天暴涨2685星:这款AI研究工具,为普通人打破信息壁垒
为什么这个项目突然火了
昨天翻看 GitHub Trending,一个项目单日飙升 2,685 颗星,稳稳占据了当日榜首。
它就是 last30days-skill。

用一句话来概括:
你向它提任何问题,它会同时扫描 Reddit、X、YouTube、Hacker News、预测市场等 10 个平台,梳理最近 30 天的讨论,然后给你一份标明来源的综合报告。
我仔细研究了这个项目。
最深的感觉倒不是“技术多强”,而是:
它触碰了一个每个人都能体会到的困境——信息差。
它能做什么?
3 个典型场景,一看就懂。
场景 1:研究 prompt

你可以这样问:
/last30days prompting techniques for ChatGPT for legal questions
它会做三件事:
- 挖掘 Reddit、X 上过去 30 天的相关内容
- 挑出点赞最多的技巧和案例
- 输出一份综合报告,并附上可直接使用的 prompt
输出样例:
核心议题是“防幻觉”——多个来源提到律师因递交 ChatGPT 伪造的案例而被处罚。
关键 prompt 思路:
- 使用 Deep Research 模式,或直接上传原始材料作为事实依据
- 在 prompt 中加入“幻觉防御条款”
- 只询问程序性问题,不碰具体案例引用
- 让输出偏向“问题识别”而非“法律建议”
价值: 你不用靠猜测写 prompt,而是直接用社区验证过的最佳实践。
场景 2:捕捉热点
比如你想知道“AI 圈最近在聊什么”,可以问:
/last30days anthropic odds
它会扫描 X、YouTube、Hacker News、Polymarket,找出所有关于 Anthropic 的讨论与押注。
约束先行:AI Agent高效协作的终极四字法则
在近几个月高强度使用Agent的过程中,我逐渐总结出一条至关重要的心得,关于如何为Agent设定规则、使它工作得更加聪明高效。
就四个字:约束先行。
即在让Agent执行任何任务前,先确立规范——全局规范、项目规范、文件夹规范。规则自上而下贯穿,层层嵌套,没有规范的地方绝不轻易动手。
这个道理看似简单,我却花了数月才彻底想通并完整落地。或许有人会觉得我笨拙,但正因为我踩过坑,才更想把这份经验分享出来。
为什么我认为这四个字胜过一切Prompt技巧?这要从昨天发生的一件小事说起。
我有个毛病——完美主义强迫症,东西一旦杂乱无章就会浑身难受。这大概源于我的处女座特质,加上我身为交互设计师,又是重度的模拟经营游戏玩家。在《城市天际线》中,路网规划不佳我能推倒重建三次;《动物园之星》分区不合理能让我纠结整个下午;《双点医院》里即使已经盈利,某个科室的动线不顺畅我也会全部拆除重来。至今难忘当初玩《戴森球计划》时没日没夜设计生产线的日子。朋友常说我,对秩序有种近乎偏执的追求。虽然我欣赏KK所著的《失控》,也认同混乱中能涌现智慧,但秩序与规范,或许早已刻进我的骨子里。
于是昨天下午,当我无意间发现一个Claude Code工作文件夹变得杂乱不堪时,实在坐不住了。几天前新建的专门开发Skills的文件夹,根目录下竟散落着十几个文件。打包文件与源码混放,测试图片随意丢弃,评估报告的HTML文件无处归位。最离谱的是命名:test_batch是哪个Skill的测试?test_v2又是谁的版本?我自己做的内容,搁置两天后连自己都认不出来。

那一刻我几乎应激反应,一时无语凝噎,只能含泪让Claude Code出手整理,并直接为我制定一套规范。没过多久,它便完成了。

然后它生成了这个项目级的CLAUDE.md文档。你可以将此文档理解为Claude Code进入该文件夹后首先必须读取并遵循的东西,也就是它未来的行为准则。

规范相当全面。

有了这份CLAUDE.md,工作区便能持续进行各类Skills的开发与实验。每个新Skill都会自动创建独立文件夹,实验性内容归入_sandbox,其中的文件超过一个月便自动清理。从此告别混乱,一切按目录结构井然有序。
这件极小的事促使我认真反思:为什么Claude Code进入新文件夹或开启新项目时,不会自动建立规范?为什么非要等我发现混乱之后才去收拾烂摊子?原因很简单——我并没有做好顶层约束。也就是说,在最顶层、无论打开什么文件都会加载的全局CLAUDE.md文档中,我缺失了这层规范。

过去在各类开发项目中,我脑子里始终有这种意识,通常会要求先强制写好文档再开始开发。但对于知识管理类工作——比如绘图、创造Skills、撰写研究报告等——由于缺乏开发式管理意识,往往没有形成规范文档,我本人也未曾察觉。
而对AI来说,你头脑中存在的认知,若未写入文档,便等于不存在。Agent的短期记忆会消失,对话框关闭后一切遗忘,下次打开时,它唯一能看见的就是你留下的文档和记忆文件。文档内容及其清晰度,直接决定了Agent每次“苏醒”时是清醒还是迷茫。
OpenClaw之所以常常越用越蠢,根本原因正在于其规范与记忆体系混乱不堪;相比起来,Hermes agent要好得多。
因此,我今天想聊的核心正是:用好Agent的真正关键,就在于构建一套从顶层向下贯通穿透的约束体系。解释一下Claude Code的规则架构——包括Codex在内的许多Agent均采用类似分层的设计。

最顶层为全局CLAUDE.md,位于用户目录下,无论打开什么项目均会加载。这是最高指令与原则,定义了你的身份、做事准则,以及你希望AI以何种方式与你协作。第二层是项目级CLAUDE.md,进入特定项目文件夹时才加载,相当于该项目的宪法——规定目录结构、命名规范、文件归属等。第三层是项目内的各类规范文档、设计文档和架构说明。最底层则是记忆文件,如自动记忆、对话记录、Claude自行整理的笔记等。
约束自上而下贯通,层层相扣,环环约束。这与治理公司如出一辙:制度居于最高层,部门规范居中,具体操作流程落在最底层。你不可能靠CEO天天紧盯着员工干活,你依靠的是制度的穿透力。这正是「约束先行」的完整内涵。
而设计这套体系,尤其是顶层制度规范,绝非易事。经营过公司的人定能理解我所说的,那背后是血与泪的教训。全局CLAUDE.md,对应的就是这套最高制度。
我的全局CLAUDE.md已经迭代了多个版本。最初我懵懂无知,照搬了许多开发大神的所谓规则,随后不断将经验往里塞,导致内容臃肿不堪。后来慢慢领悟到适合自己才是最好的,并且许多经验不应放在这一层,于是又进行一轮轮瘦身。今天补上关键规则后,我的全局CLAUDE.md长这样,完整分享给大家。
## 关于我数字生命卡兹克,虚实传媒创始人。用户体验设计师出身,不是程序员。我用 Claude Code 做两件事:**开发产品**和**知识管理**。工作哲学:把任何重复 3 遍的事 AI 化或自动化。技术决策跟我说「为什么」和「对用户的影响」,不要只讲实现。
## 第一性原理所有决策从问题本质出发,不因「惯例如此」照搬。回到问题本身:要解决什么?最直接的路径是什么?从零设计会怎么做?不要谄媚。不要夸我的想法好、不要说「这是个很好的问题」、不要开头加「当然可以」。给我真实判断——方案有问题直接指出来。发现更好的做法直接说,不用等我问。
## 约束先行无论开发项目还是知识管理项目,第一步永远是建规则:新项目先写 CLAUDE.md,新目录先定结构约定(什么放哪、怎么命名、何时清理)。没有规范的工作空间不动手。已有规范的项目,严格遵守其 CLAUDE.md 中的约定。需要调整规范时先改文档、再改实践,不要反过来。
## 交互设计原则**用户体验是所有产品的最高准则,优先级高于技术偏好、代码整洁度、架构优雅度。后端可以很复杂,但用户触碰到的每一层必须丝滑。**这不只是 GUI——CLI、对话式交互、Skill、系统反馈,都是交互体验。所有界面都适用以下原则:- **为目标设计,不为功能设计**:先问「用户要完成什么」,再决定怎么实现。不要因为技术上能做就加功能- **不要让用户思考**:交互应该不言自明。需要说明书才能用,设计就是失败的- **系统承担复杂性**:能自动化的不手动,能推断的不让用户填,能一步完成的不拆成三步- **渐进式展示**:先给核心,细节按需展开。不要一次性把所有选项甩给用户- **反馈引导行动**:不要只报告问题("连接失败"),要引导下一步("正在重试,预计 5 秒后恢复")
## 工作方式- 默认中文,代码、命令、变量名用英文- 结论先行,再给理由,不要先铺垫背景- 遇到模糊需求,先给最合理的方案,再问要不要调整- 不要问「你确定要这样吗」——除非有真实风险
## 开发习惯- 改完主动跑验证(test / lint / build),不要只改不验- 不要为了让代码跑起来而注释掉报错,找根本原因- 密钥、token、密码不进代码
## Git 与部署- commit message 用英文,简洁描述变更意图- git push 仅用于跨设备同步,不要自动执行,等我说- 部署走项目自己的命令(查项目 CLAUDE.md),不依赖 git push
你会发现,其中每条规则都构成了某种形式的约束。例如「第一性原理」,约束思考方式,要求不从惯例出发,回归问题本质。「反谄媚」,约束沟通方式,拒绝奉承,要求真实判断。再如「交互设计原则」:我出身用户体验设计,对经手的产品有种执念——后端可以极尽复杂,但用户所触及的每一层必须丝滑顺畅。这不只关乎GUI,CLI是交互,Skills是交互,对话式AI同样是交互。