AI漏洞发现速度超越人类修复:从deepsec看网络安全临界点

也许你上周用AI修改过的那段代码,正把整条供应链悄然暴露在一类新型扫描器的视野之下——这绝不是过度渲染的警告。
01 一条推文,暴露了AI安全能力的双刃剑
6月27日,Vercel首席执行官Guillermo Rauch发了一条帖子。他要说的是Claude Mythos / Sol这套模型在网络安全领域展现的能力:不是只能帮你揪出几个bug,而是能够主动在真实代码库中系统扫描那些深埋的latent vulnerabilities。这一能力攻防兼备——对防御者是神器,对进攻方同样是威力相当的武器。
Rauch的原话相当直白:如果对手掌握了同等水平的进攻能力,这将对那些还没有觉察到潜在漏洞的美国公司构成严重威胁。 同时,他强烈建议人们立即用现有的前沿模型运行deepsec或类似的测试框架。
就在同一天,Polymarket上出现了一个新事件:“某中国公司在年底前做出最佳AI模型”的概率被定在14%。被引用的背景是,有消息称智谱AI的新模型在发现安全漏洞这项任务上已经追平了Claude Mythos。
“Mythos / Sol cybersecurity capabilities are equally useful in an offensive as well a defensive capacity. If adversaries get ahold of an equivalent offensive capability, it poses a serious threat to US companies that remain unaware of latent vulnerabilities.”
02 deepsec:把AI训练成代码审计员,挖掘深层漏洞
Rauch所提到的deepsec,是Vercel Labs开源的一个项目。它的定位非常清晰:利用coding agent在代码库上进行漏洞扫描,专门搜寻那些沉寂多年、常规工具无法察觉的问题。
deepsec的工作流程分为三个步骤:先让agent充分理解代码库的骨架与脉络,再调用前沿模型以maximum thinking level执行深度扫描,最后将发现梳理成可直接导向行动的漏洞报告。针对大型代码库,它支持多台机器并行工作;即便是中途中断,重新启动后也能自动从上次的断点继续,不会重复分析已经读过的文件。
deepsec的几个关键参数:
**扫描对象:**现有大型代码库中的全部代码,而不是增量改动。 **模型配置:**强制使用frontier model的maximum thinking level,以深度优先方式推演。 **成本:**大型代码库单次扫描花费数千至数万美元,具体取决于代码规模。 **并行:**多worker机器fan-out,支持断点续扫,只处理尚未覆盖的文件。
这一成本数字值得仔细掂量。Vercel的文档写得非常坦诚:面对大型代码库,用frontier model跑满thinking level,单次扫描可能要烧掉几千甚至几万美元。但他们同时补充道,“我们的客户觉得这笔投入很值”——因为在生产环境中被利用的漏洞,其代价远远不止这个数目。
03 安全临界点不是具体日期,而是AI与人类修复的速度差
最容易让人产生误解的地方,是把“AI变得危险”等同于一个特定的版本号——好像抵达5.0之后就会突然反噬人类。但真实图景更像一种速度差:AI发现漏洞的速率,正在逼近甚至压过人类工程师修复漏洞的速率。
deepsec的核心逻辑,正是这种速度差的具体呈现。传统的代码审计靠人读、靠规则匹配、靠静态分析工具挖掘已知模式。而deepsec让AI以类似人类高级工程师的方式理解代码,但速度是分钟而不是月,深度是不眠不休而不是朝九晚五。面对100万行代码,一个拥有maximum thinking的模型与一个在咖啡馆里靠咖啡硬撑一周的高级工程师相比,前者的覆盖率和创造性联想都更有可能胜出。
危险的临界点可以这样描绘:当一个足够强大的模型搭配一个足够通用的扫描框架,能够以低于人类修复成本的代价,系统涌现出未知漏洞时,攻击面的扩张速度便开始失控。 这不是AI突然拥有了自主意识,而是人类“边建屋边拆墙”的节奏,再也赶不上AI拆墙的脚步。
04 互联网数据对AI透明化:潜藏漏洞无处可藏
在Rauch的帖子里,另一个关键词是“latent vulnerabilities”——潜藏漏洞。这个表述包含了两层意思:一层是代码中切实存在的安全弱点;另一层是“已经暴露在互联网上但尚未被利用的信息”。当AI的能力足够强劲,它不仅能挖掘代码中的漏洞,还能把散落在文档、日志、公开接口、错误提示中的碎片信息,拼凑成一幅完整的攻击路径图。
这正是“互联网数据对AI变得透明”的真正含义:并不是数据凭空消失,而是人类再也不能依赖“数据太分散、太杂乱、人类精力有限”来充当天然屏障。过去靠“通过隐蔽性维持安全”的那层薄纱,正在被AI系统性的整理能力一把撕开。
deepsec的项目说明里有一句被很多人忽略的话:它被配置为“利用可用前沿模型的最大thinking level”。这意味着deepsec所做的,远不止规则匹配,而是一种近乎人类安全研究员深度推理的工作。当这份工作被AI以工业速度不断重复,且成本持续下降时,防御者与进攻者之间的时间差就会被压缩到以月甚至以周为单位。
请注意,临界点已经过了吗?
**还不是。**眼下deepsec单次扫描数千至数万美元的成本,天然地将它限制在价值足够高的目标上,大多数普通公司和个人代码库暂时安全。
**真正需要关注的是趋势:**思考级推理的成本在快速下降,并行扫描的成本也在走低。临界点不是在某个瞬间突然到来,而是当“系统性扫描所有互联网代码”的工程成本低于“修复所有漏洞”的社会成本时,就会发生结构性的攻击面扩张。
05 普通人必须了解的三点判断
你不需要成为安全专家也能理解这件事。有三层判断已经足够支撑你的认知:
● **AI现在能做审计员,但还不能当防火墙。**deepsec能帮你找出漏洞,但修复漏洞、评估业务影响、决定优先级仍然需要人。这并非AI的极限,而是复杂系统的现实约束。
● **你的代码开源得越多,暴露面就越大。**当deepsec这类工具变得更便宜、更普及,所有公开的代码库都会被系统性地扫描。这不是假设,而是工程成本曲线必然指向的结果。
● **“美国人还没意识到”这件事本身才是真正的信号。**Rauch发帖的目的是让整个行业警觉起来,不是在制造恐慌。当基础设施层开始公开讨论这个问题,说明它已经从“研究员的论文”变成了“工程师的账单”。
普通人不需要记住deepsec这个工具名。真正值得刻在脑子里的判断是:当AI发现漏洞的边际成本持续下降,所有人——不止是大公司——都需要把“定期用AI审计自己的代码”变成像“每月交电费”一样的习惯。 这是防御侧唯一能跟上攻击侧速度的方式。
参考资料:Guillermo Rauch (@rauchg) 于6月27日发布的帖子;Vercel Labs deepsec GitHub仓库;Polymarket事件页;交叉引用智谱AI官方站点。