Mozilla 对 Firefox 的说法,让本已紧张的 AI 安全争论进一步升温
Mozilla 表示,Anthropic 的 Mythos Preview 模型帮助其在浏览器发布前识别出 Firefox 150 中的 271 个安全漏洞,这一结果立即提升了人们在理解先进 AI 将如何影响网络安全这场竞赛中的赌注。
Ars Technica 报道的这一发现,为此前主要由推测、基准测试说法和 AI 公司警告推动的争论,增加了不同寻常的具体证据。4 月初,Anthropic 曾表示,Mythos 在发现漏洞方面如此高效,以至于公司将其最初发布范围限制在少数关键行业合作伙伴中。Mozilla 报告中的经历,如今成为这一能力在实践中可能呈现何种效果的最清晰现实信号之一。
Firefox CTO Bobby Holley 以宏观方式描述了其影响,认为防御性安全团队或许终于开始占据优势。即便没有披露 271 个漏洞的具体严重程度,报道结果的规模也很难忽视。
从几十个漏洞到一个发布周期中的数百个
原始报道中最引人注目的比较,不是 AI 与人类之间的比较,而是上一代 AI 模型与下一代模型之间的比较。Holley 说,Anthropic 的 Opus 4.6 模型在上个月分析 Firefox 148 时发现了 22 个与安全相关的漏洞。Mythos Preview 在检查 Firefox 150 时,据称发现了 271 个漏洞。
如果这些数字具有可比性,那么这一跃升是戏剧性的。它表明,模型在漏洞分析方面的进展可能并不是线性的。即便考虑目标代码或搜索条件的差异,在如此短的时间内从几十个发现跃升到数百个,也意味着能力发生了实质性变化。
原始报道称,该模型只是通过分析尚未发布的源代码就发现了这些问题。这一点很重要,因为它将模型定位为一种推理系统,而不是需要大规模执行的自动化模糊测试引擎;它能够审视代码库并标记可能的漏洞。
Holley 将这项工作比作自动化模糊测试,或一流人类研究者对复杂浏览器代码进行推理后可能完成的工作。他认为,实际区别在于成本和速度。如果 AI 模型无需数月高度集中的专家投入就能发现安全缺陷,那么防御性审查就会变得更便宜,也更具可扩展性。
为什么浏览器安全是一个有意义的测试场景
浏览器是世界上最复杂、也最常遭受攻击的消费级软件产品之一。它们持续处理不受信任的输入,代码库庞大,并且需要谨慎处理内存、渲染、脚本、网络和沙箱隔离。
这使 Firefox 成为检验 AI 驱动漏洞发现能力的强力测试环境。一个能够在现代浏览器中发现有意义漏洞的模型,做的事情远不只是赢得一个玩具式基准测试。它是在一个真实缺陷可能影响数百万用户、且专家安全审查本身已经高度成熟的领域中运作。
原始报道没有说明 271 个漏洞的严重程度分布。这个缺失信息很重要。数百个低严重度问题,其战略意义不会与数百个高影响漏洞相同。不过,即使只是能够在公开发布前预先识别大量与安全相关的漏洞,也会代表软件防御工作流的重大变化。
防守者与攻击者之间的优势之争越来越难回答
过去几个月,围绕先进 AI 的网络安全讨论一直在警报与怀疑之间摇摆。一方担心强大的模型会让攻击者更容易、更大规模地利用漏洞。另一方则认为,AI 主要只是加速了防御方原本就要做的工作,炒作往往超过了实际效果。
Mozilla 报告的 Mythos 使用情况并没有终结这场争论,但确实推动了讨论向前发展。按照原始报道中的描述,Holley 的观点是,更便宜的漏洞发现有利于防御者,因为软件供应商可以在攻击者利用问题之前发现并修复它们。
这很有可能,尤其是对于那些能够接触前沿模型,并具备将其集成进安全开发流程的工程能力的组织而言。但如果类似系统更广泛地可用,或者流入进攻性工具链,同样的基础能力也可能惠及攻击者。
换句话说,优势可能不在于 AI 能否发现漏洞,而在于谁能更快、更负责任地将这种能力投入实际运用。
软件开发内部会发生什么变化
如果 Mozilla 的结果站得住脚,AI 辅助代码审查可能会从“锦上添花”变成大型软件项目的基础要求。原始报道称,Holley 对 Wired 表示,未来每一份软件都可能需要接触这种 AI 辅助分析,因为每一份软件都将从外部暴露在同样的能力面前。
这会建立一个新的最低标准。那些没有使用强大 AI 工具来检查代码的项目,可能会在面对攻击者或使用这些工具的竞争对手时处于劣势。安全审查可能会越来越像在传统测试、模糊测试和人工研究之上叠加持续的 AI 分流处理。
这也可能改变安全团队内部的劳动分工。高技能研究人员可能会减少手动钻研低产出代码路径的时间,更多时间用于验证、排序,以及利用或修复模型生成的发现。在这种情况下,AI 并不是取代顶级安全工作,而是改变其经济结构。
缺失的细节仍然重要
这个头条数字令人印象深刻,但悬而未决的问题同样不少。原始报道没有披露这些漏洞中有多少是严重漏洞,有多少本可以被现有内部工具发现,以及误报率如何。它还没有说明,模型表现是否依赖于特权指导、工具,或难以广泛复现的提示方式。
这些保留意见并不会抹去结果的重要性。它们只是界定了仍未知的部分。安全方面的主张,只有在外部研究人员能够在多个代码库和运行环境中长期验证时,才最具说服力。
AI 进入网络防御的分水岭时刻
即便存在这些不确定性,Mozilla 的说法仍感觉像一个分水岭。直到现在,关于前沿 AI 和网络能力的说法往往听起来像假设,或带有自我宣传意味。一个浏览器厂商说某个模型帮助其在一个重要版本中发现了 271 个漏洞,这让这场争论变得更加具体。
如果这个数字反映的是真实且有意义的安全缺陷,那么先进 AI 现在已经开始改变软件保障的经济性。这并不能保证防御方已经像 Holley 所说的那样明确获胜。但它确实表明,竞争已经进入一个新阶段,在这个阶段里,以机器速度推理代码的能力正成为一种实际安全因素,而不再只是未来的可能性。
接下来的问题不再是 AI 是否能在漏洞研究中发挥作用,而是整个软件行业会多快适应一个它早已发挥作用的世界。
本文基于 Ars Technica 的报道。阅读原文。
Originally published on arstechnica.com






