AI漏洞发现速度超越人类修复：从deepsec看网络安全临界点

June 28, 2026

也许你上周用AI修改过的那段代码，正把整条供应链悄然暴露在一类新型扫描器的视野之下——这绝不是过度渲染的警告。

01 一条推文，暴露了AI安全能力的双刃剑

6月27日，Vercel首席执行官Guillermo Rauch发了一条帖子。他要说的是Claude Mythos / Sol这套模型在网络安全领域展现的能力：不是只能帮你揪出几个bug，而是能够主动在真实代码库中系统扫描那些深埋的latent vulnerabilities。这一能力攻防兼备——对防御者是神器，对进攻方同样是威力相当的武器。

Rauch的原话相当直白：如果对手掌握了同等水平的进攻能力，这将对那些还没有觉察到潜在漏洞的美国公司构成严重威胁。 同时，他强烈建议人们立即用现有的前沿模型运行deepsec或类似的测试框架。

就在同一天，Polymarket上出现了一个新事件：“某中国公司在年底前做出最佳AI模型”的概率被定在14%。被引用的背景是，有消息称智谱AI的新模型在发现安全漏洞这项任务上已经追平了Claude Mythos。

“Mythos / Sol cybersecurity capabilities are equally useful in an offensive as well a defensive capacity. If adversaries get ahold of an equivalent offensive capability, it poses a serious threat to US companies that remain unaware of latent vulnerabilities.”

02 deepsec：把AI训练成代码审计员，挖掘深层漏洞

Rauch所提到的deepsec，是Vercel Labs开源的一个项目。它的定位非常清晰：利用coding agent在代码库上进行漏洞扫描，专门搜寻那些沉寂多年、常规工具无法察觉的问题。

deepsec的工作流程分为三个步骤：先让agent充分理解代码库的骨架与脉络，再调用前沿模型以maximum thinking level执行深度扫描，最后将发现梳理成可直接导向行动的漏洞报告。针对大型代码库，它支持多台机器并行工作；即便是中途中断，重新启动后也能自动从上次的断点继续，不会重复分析已经读过的文件。

deepsec的几个关键参数：

**扫描对象：**现有大型代码库中的全部代码，而不是增量改动。 **模型配置：**强制使用frontier model的maximum thinking level，以深度优先方式推演。 **成本：**大型代码库单次扫描花费数千至数万美元，具体取决于代码规模。 **并行：**多worker机器fan-out，支持断点续扫，只处理尚未覆盖的文件。

这一成本数字值得仔细掂量。Vercel的文档写得非常坦诚：面对大型代码库，用frontier model跑满thinking level，单次扫描可能要烧掉几千甚至几万美元。但他们同时补充道，“我们的客户觉得这笔投入很值”——因为在生产环境中被利用的漏洞，其代价远远不止这个数目。

03 安全临界点不是具体日期，而是AI与人类修复的速度差

最容易让人产生误解的地方，是把“AI变得危险”等同于一个特定的版本号——好像抵达5.0之后就会突然反噬人类。但真实图景更像一种速度差：AI发现漏洞的速率，正在逼近甚至压过人类工程师修复漏洞的速率。

deepsec的核心逻辑，正是这种速度差的具体呈现。传统的代码审计靠人读、靠规则匹配、靠静态分析工具挖掘已知模式。而deepsec让AI以类似人类高级工程师的方式理解代码，但速度是分钟而不是月，深度是不眠不休而不是朝九晚五。面对100万行代码，一个拥有maximum thinking的模型与一个在咖啡馆里靠咖啡硬撑一周的高级工程师相比，前者的覆盖率和创造性联想都更有可能胜出。

危险的临界点可以这样描绘：当一个足够强大的模型搭配一个足够通用的扫描框架，能够以低于人类修复成本的代价，系统涌现出未知漏洞时，攻击面的扩张速度便开始失控。 这不是AI突然拥有了自主意识，而是人类“边建屋边拆墙”的节奏，再也赶不上AI拆墙的脚步。

04 互联网数据对AI透明化：潜藏漏洞无处可藏

在Rauch的帖子里，另一个关键词是“latent vulnerabilities”——潜藏漏洞。这个表述包含了两层意思：一层是代码中切实存在的安全弱点；另一层是“已经暴露在互联网上但尚未被利用的信息”。当AI的能力足够强劲，它不仅能挖掘代码中的漏洞，还能把散落在文档、日志、公开接口、错误提示中的碎片信息，拼凑成一幅完整的攻击路径图。

这正是“互联网数据对AI变得透明”的真正含义：并不是数据凭空消失，而是人类再也不能依赖“数据太分散、太杂乱、人类精力有限”来充当天然屏障。过去靠“通过隐蔽性维持安全”的那层薄纱，正在被AI系统性的整理能力一把撕开。

deepsec的项目说明里有一句被很多人忽略的话：它被配置为“利用可用前沿模型的最大thinking level”。这意味着deepsec所做的，远不止规则匹配，而是一种近乎人类安全研究员深度推理的工作。当这份工作被AI以工业速度不断重复，且成本持续下降时，防御者与进攻者之间的时间差就会被压缩到以月甚至以周为单位。

请注意，临界点已经过了吗？

**还不是。**眼下deepsec单次扫描数千至数万美元的成本，天然地将它限制在价值足够高的目标上，大多数普通公司和个人代码库暂时安全。

**真正需要关注的是趋势：**思考级推理的成本在快速下降，并行扫描的成本也在走低。临界点不是在某个瞬间突然到来，而是当“系统性扫描所有互联网代码”的工程成本低于“修复所有漏洞”的社会成本时，就会发生结构性的攻击面扩张。

05 普通人必须了解的三点判断

你不需要成为安全专家也能理解这件事。有三层判断已经足够支撑你的认知：

●　**AI现在能做审计员，但还不能当防火墙。**deepsec能帮你找出漏洞，但修复漏洞、评估业务影响、决定优先级仍然需要人。这并非AI的极限，而是复杂系统的现实约束。

●　**你的代码开源得越多，暴露面就越大。**当deepsec这类工具变得更便宜、更普及，所有公开的代码库都会被系统性地扫描。这不是假设，而是工程成本曲线必然指向的结果。

●　**“美国人还没意识到”这件事本身才是真正的信号。**Rauch发帖的目的是让整个行业警觉起来，不是在制造恐慌。当基础设施层开始公开讨论这个问题，说明它已经从“研究员的论文”变成了“工程师的账单”。

普通人不需要记住deepsec这个工具名。真正值得刻在脑子里的判断是：当AI发现漏洞的边际成本持续下降，所有人——不止是大公司——都需要把“定期用AI审计自己的代码”变成像“每月交电费”一样的习惯。 这是防御侧唯一能跟上攻击侧速度的方式。

参考资料：Guillermo Rauch (@rauchg) 于6月27日发布的帖子；Vercel Labs deepsec GitHub仓库；Polymarket事件页；交叉引用智谱AI官方站点。