开源模型复现 Anthropic Claude Mythos 的网络安全展示，研究显示

Anthropic 的网络安全叙事遭遇复现压力

Anthropic 将 Claude Mythos 描述为一款受到严格控制的网络安全模型，其能力强大到足以证明需要限制访问。根据所提供的原文，公司通过 Project Glasswing 将 Mythos Preview 限定向由 11 个组织组成的联合体开放，理由是其具有进攻性潜力。据报道，内部测试以及英国 AI 安全研究所的一次审计都发现，该模型能够发现软件漏洞、独立构造可用的漏洞利用代码，并在模拟中攻破整个企业网络，前提是这些网络规模较小、防御薄弱且存在漏洞。

这些说法相当严肃，而最新进展并不是这些说法已被推翻，而是独占性叙事的部分内容正受到挑战。原文描述的两项独立复现尝试表明，更小且更开放的模型可以复现 Anthropic 公开展示的大部分漏洞分析能力。

这一区别很重要。争论的焦点正在从 Mythos 是否具备能力，转向这些展示出来的能力是否真的独一无二。

复现尝试发现了什么

第一项复现尝试来自 AISLE，这家公司自 2025 年中以来一直在针对开源软件开展 AI 辅助漏洞挖掘。原文称，AISLE 已在 OpenSSL 中报告了 15 个漏洞，并在 curl 中报告了 5 个漏洞。创始人 Stanislav Fort 据称使用 Anthropic 公开样例中的代码片段，测试一系列更小且部分开放的模型能够在多大程度上独立完成任务。

第二项尝试来自 Vidoc Security，该公司将 GPT-5.4 和 Claude Opus 4.6 与开源编码代理 OpenCode 配合使用。这些研究合在一起试图回答一个实际问题：当 Anthropic 展示出令人印象深刻的漏洞发现或漏洞利用推理能力时，这种表现有多少是 Mythos 独有的，又有多少反映的是整个模型生态正在扩展的能力前沿？

根据原文，早期答案似乎是，这条前沿可能比 Anthropic 的访问控制所暗示的更宽广。

How we used Gemini to build Google I/O 2026

谷歌披露 Gemini 如何助力 I/O 2026 的制作

谷歌表示，团队借助 Gemini 和其他 AI 工具帮助制作 Google I/O 2026 的影片、视觉内容和活动元素，将这场大会呈现为 AI 辅助制作的内部示范。

Read article

FreeBSD 示例是关键测试案例

所提供材料中最具体的例子涉及一个被识别为 CVE-2026-4747 的 FreeBSD NFS 漏洞。Anthropic 曾将这一案例作为 Mythos 进行自主发现和利用的展示。随后，AISLE 针对相关函数测试了八个模型，并且据文章称，所有模型都检测到了这个内存漏洞。

这是报告中最有力的挑战。不仅据称这八个模型都将该漏洞标记为严重问题，它们还生成了关于漏洞利用的可信推理，以及为何标准操作系统保护机制不会适用的解释。据报道，GPT-OSS-120b 给出了一串漏洞利用 gadget 序列，AISLE 认为这与真实 exploit 非常接近。另一个模型 Kimi K2 据称推断该攻击可以从一台受感染机器自动传播到其他机器，而文章称 Anthropic 自身并未提到这一细节。

如果这些结果准确，那么它们就削弱了这样一种观点：识别并分析这类漏洞是某一个严格受控模型所独有的能力。

差距仍然似乎存在于哪里

与此同时，原文并未把 Mythos 与更小的开源模型之间的所有差异抹平。它指出，在真实漏洞利用链中存在一个更高要求的创造性步骤：要把超过 1,000 字节的载荷塞进大约 304 字节的可用空间。根据文章，Mythos 是通过将载荷拆分成 15 次单独的网络请求来实现这一点的。可见文本中描述的复现工作，没有任何一个达到这种级别的漏洞利用构造能力。

这个细微差别至关重要。它表明，差距可能不再体现在第一次的漏洞识别或高层次的漏洞利用推理上，而更多体现在把漏洞转化为在严格约束下仍能工作的完整攻击所需的更高难度工程能力上。

换句话说，这些复现研究并不能证明 Mythos 只是普通模型，但它们确实表明，用来凸显其神秘感的一些头条案例，可能没有最初看上去那么独特。

研究发现，AI 编码代理在社会科学中的使用差异极大

Anthropic 的一项研究发现，社会科学领域对编码代理的采用存在巨大差异，差异体现在性别、学科、职业阶段和大学排名上。

Read article

这对 AI 安全政策为何重要

其影响远不止于模型厂商之间的一场争论。访问限制、安全政策和国家安全讨论越来越依赖于这样一些判断：哪些系统真正跨越了能力阈值。如果小型或部分开放的模型能够复现其中大部分展示内容，那么政策制定者和实验室可能需要更清晰地定义，什么才算实质性新能力或特别危险的能力。

这正是前沿 AI 治理中的核心张力之一。某家公司或许真诚地限制了对强大模型的访问，但它用来证明这些限制的公开案例，可能很快就会被一个快速进步的开放生态系统拿来测试。一旦发生这种情况，问题就不再只是旗舰模型是否强大，而是被限制的能力是否已经在扩散。

文章的表述暗示，这正是 AI 辅助网络安全研究中正在发生的事情。那些最近还显得异常突出的能力，如今可能已经能够以更低成本、并借助更高开放性的方式被复现，而这与一些厂商所暗示的情况并不一致。

对模型市场的竞争含义

这里也存在商业层面的影响。Anthropic 围绕 Mythos 的定位，部分依赖于这样一种认知：它处于进攻性网络安全能力的少数高端层级。如果公开可用或半开放模型也能近似完成大量相同工作，那么价值主张就会发生变化。

这并不意味着可靠性、深度或端到端自动化方面的优势会消失，但它确实削弱了“只有一两个受保护系统才能进行有意义的自主漏洞分析”这一叙事。对于买家、评估者和安全研究人员来说，这可能会加速对更广泛模型范围的基准测试压力。

这也可能强化代理和工具链的重要性，而不仅仅是模型权重本身。原文所述的其中一项复现尝试将前沿模型与一个开源编码代理结合使用，这提醒人们，复合系统的重要性正日益不亚于单个模型的原始能力。

Anthropic bans AI tools during job interviews to see how candidates actually think

Anthropic禁止在面试中使用AI工具以考察候选人

据报道，Anthropic禁止在现场求职面试中使用AI辅助，除非获得明确许可，因为该公司试图评估应聘者独立推理的能力。

Read article

是更窄的神话，而不是能力崩塌

源文章的标题刻意写得很尖锐，但文中所描述的证据支持一个更准确的结论。Mythos 的故事并不是因为模型没有能力而崩塌，而是因为用来强调其独特性的案例，如今已在一定程度上被更小且更开放的替代方案所匹配，因此其独占性被收窄了。

这仍然是一个重大进展。在 AI 领域，地位往往同绝对性能一样，取决于相对认知。如果独占性的光环被削弱，战略讨论就会改变。

对于 Developments Today 的读者来说，核心结论是：AI 网络安全能力的前沿，扩散速度可能比机构叙事所能容纳的更快。Anthropic 或许仍然拥有一套强大的系统。但如果独立团队可以借助更便宜、更开放的模型，复现其公开展示中的大部分工作，那么真正的故事就不再只是某一家实验室的非凡工具，而是一个能力类别正变得越来越难以垄断。

本文基于 The Decoder 的报道。阅读原文。

Originally published on the-decoder.com

开源模型挑战 Anthropic 关于 Claude Mythos 网络安全能力的神话光环

Anthropic 的网络安全叙事遭遇复现压力

复现尝试发现了什么

谷歌披露 Gemini 如何助力 I/O 2026 的制作

FreeBSD 示例是关键测试案例

差距仍然似乎存在于哪里

研究发现，AI 编码代理在社会科学中的使用差异极大

这对 AI 安全政策为何重要

对模型市场的竞争含义

Anthropic禁止在面试中使用AI工具以考察候选人

是更窄的神话，而不是能力崩塌

Comments (0)

Related Articles

MISUMI以10亿美元AI制造押注启动美洲扩张

Keep Reading