Anthropic のサイバーセキュリティ物語に再現圧力がかかる
Anthropic は Claude Mythos を、アクセス制限を正当化できるだけの強力な能力を備えた、厳格に管理されたサイバーセキュリティモデルとして提示してきた。提示されたソース文によれば、同社は Project Glasswing を通じて Mythos Preview を 11 の組織からなるコンソーシアムに限定し、その理由として攻撃的な潜在能力を挙げていた。内部テストや英国の AI Security Institute による監査では、このモデルがソフトウェアのバグを見つけ、自力で実用的なエクスプロイトを構築し、シミュレーション上で企業ネットワーク全体を侵害できたと報告されている。ただし、そのネットワークは小規模で、防御が弱く、脆弱であることが条件だった。
これは重大な主張の集合であり、新しい動きはそれらが否定されたことではない。むしろ、排他性をめぐる物語の一部が今、挑戦を受けているということだ。ソースで説明されている 2 つの独立した再現実験は、小型でよりオープンなモデルでも、Anthropic が公開してきた脆弱性分析の多くを再現できることを示唆している。
この違いは重要だ。議論の焦点は、Mythos が能力を持つかどうかから、示された能力が本当に唯一無二なのかどうかへ移っている。
再現実験が見つけたもの
最初の再現実験は AISLE によるものだった。AISLE は 2025 年半ば以降、オープンソースソフトウェアを対象に AI 支援のバグハントを行っている企業だ。ソースによると、AISLE は OpenSSL で 15 件、curl で 5 件の脆弱性を報告している。創業者の Stanislav Fort は、Anthropic の公開サンプルからコード断片を使い、小型で一部オープンな複数のモデルが自力でどこまで到達できるかを試したという。
2 つ目の取り組みは Vidoc Security によるもので、GPT-5.4 と Claude Opus 4.6 をオープンなコーディングエージェント OpenCode と組み合わせた。これらの研究は合わせて、Anthropic が印象的なバグ発見やエクスプロイト推論を示したとき、その性能のどれだけが Mythos 固有で、どれだけがモデル全体で広がりつつある能力の前線を反映しているのか、という実務的な問いに答えようとしている。
ソース文の初期的な答えは、その前線が Anthropic のアクセス制御が示すよりも広い可能性がある、というものに見える。
FreeBSD の例が決定的なテストケース
提供資料の中で最も具体的な例は、CVE-2026-4747 として識別された FreeBSD の NFS バグだ。Anthropic はこの事例を、Mythos が自律的な発見と悪用を行った実証として強調していた。その後 AISLE は関連関数に対して 8 つのモデルをテストし、記事によれば、そのすべてがメモリバグを検出した。
これは報告の中で最も強い反証だ。8 つのモデルは全て、欠陥を深刻だと指摘しただけでなく、悪用に関するもっともらしい推論や、なぜ標準的な OS の防御が効かないのかについても reasoning を示したという。GPT-OSS-120b というモデルは、AISLE が実際のエクスプロイトにかなり近いと見なした gadget シーケンスを出力したとされる。別の Kimi K2 は、攻撃が 1 台の感染端末から他の端末へ自動的に広がる可能性を推論したとされ、記事によればこの点は Anthropic 自身も触れていなかった。
もし正確なら、これらの結果は、この種の脆弱性を見つけて分析することが、1 つの厳格に管理されたモデルだけの専売特許ではないことを示している。
それでも差が残っているように見える部分
同時に、ソース文は Mythos と小型のオープンモデルの間のすべての差を平坦化してはいない。実際のエクスプロイト連鎖でより難しい創造的ステップとして、1,000 バイト超のペイロードを約 304 バイトの利用可能領域に収める問題が挙げられている。記事によると、Mythos はペイロードを 15 回の別々のネットワーク要求に分割することでこれを実現した。可視テキストで説明された再現実験では、このレベルのエクスプロイト構築には達していなかった。
この違いは本質的だ。示唆されるのは、差がもはや最初の脆弱性認識や高レベルのエクスプロイト推論ではなく、脆弱性を厳しい制約下で完全に機能する攻撃へ変えるための、より難しいエンジニアリングにあるということだ。
つまり、再現研究は Mythos が普通だと証明しているわけではない。だが、その神秘性を支えるために使われた目玉事例のいくつかは、最初に見えたほど独自ではない可能性を示している。
AI セキュリティ政策にとってなぜ重要か
その意味は、モデルベンダー間の争いにとどまらない。アクセス制限、安全政策、国家安全保障の議論は、どのシステムが意味のある能力の閾値を超えるのかという主張に、ますます依存している。小型または一部オープンなモデルが示された作業の多くを再現できるなら、政策立案者や研究機関は、何を実質的に新しいもの、あるいは特に危険なものとみなすのかを、より厳密に定義する必要があるかもしれない。
これはフロンティア AI ガバナンスの中心的な緊張の一つだ。企業が強力なモデルのアクセスを真剣に制限していても、その制限を正当化するために用いた公開例は、急速に改善するオープンなエコシステムで即座に検証されうる。そうなれば、問題は旗艦モデルが強いかどうかだけではなく、制限された能力がすでに拡散し始めているのかどうかになる。
記事の構図は、AI 支援のサイバー研究でまさにそれが起きていることを示唆している。最近まで例外的に見えた能力が、今では一部のベンダーが示唆していたよりも低コストかつよりオープンな形で再現可能になっている可能性がある。
モデル市場における競争上の意味
商業的な側面もある。Anthropic が Mythos を位置づける際の基盤の一部は、それが稀少な攻撃的サイバー能力の層にあるという見方だ。公開または半オープンのモデルが同じ作業の多くを近似できるなら、価値提案は変わる。
それで信頼性、深さ、エンドツーエンド自動化の利点が消えるわけではない。だが、意味のある自律的な脆弱性分析を行えるのは、保護された 1 つか 2 つのシステムだけだという物語は弱まる。買い手、評価者、セキュリティ研究者にとっては、より広いモデル群でのベンチマーク圧力が加速する可能性がある。
また、モデルの重みそのものよりも、エージェントやツールチェーンの役割が強まるかもしれない。ソースで説明されている再現実験の 1 つは、フロンティアモデルにオープンなコーディングエージェントを組み合わせており、複合システムが単一モデルの生の能力と同じくらい重要になりつつあることを示している。
神話の縮小であって、能力の崩壊ではない
ソース記事のタイトルは意図的に鋭いが、記述された証拠が支持するのは、より正確な結論だ。Mythos の物語は、モデルに能力がないから崩壊しているのではない。その独自性を強調するために使われた例が、少なくとも部分的には、より小さく、よりオープンな代替手段によって再現されつつあるために、狭められているのだ。
それでもこれは大きな変化だ。AI では、地位は絶対性能だけでなく相対的な認知にも左右される。排他性のオーラが弱まれば、戦略的な議論も変わる。
Developments Today の読者にとっての核心はこれだ。AI のサイバー能力のフロンティアは、組織的な物語が収めきれない速度で広がっている可能性がある。Anthropic は依然として強力なシステムを持っているかもしれない。だが、独立したグループが、より安価でよりオープンなモデルを使ってその公開ショーケースの多くを再現できるなら、真の物語はもはや 1 つの研究所の並外れたツールだけの話ではない。それは、独占がますます難しくなる能力クラスについての話だ。
この記事は The Decoder の報道をもとにしています。元記事を読む。
Originally published on the-decoder.com




