最先端モデルをまず防御に向ける

Anthropicは、攻撃者より先に重要なソフトウェア基盤の弱点を見つけることを目的としたサイバーセキュリティ施策の一環として、新しいAIモデルのプレビュー版を、技術・セキュリティ関連組織の連合に提供していると述べた。

Project Glasswing と呼ばれるこの取り組みには、Amazon、Apple、Broadcom、Cisco、CrowdStrike、Linux Foundation、Microsoft、Palo Alto Networks などの企業・組織が参加している。Anthropicは、このモデルを防御的なセキュリティ業務に使用し、得られた知見は業界全体でより広く共有されると説明した。

この動きは、AI開発の中心で高まる緊張関係を反映している。より高性能なモデルは攻撃的なサイバー悪用のリスクを高める一方で、従来のテストでは追いつけない規模と深さで脆弱性を発見する新たな手段を防御側にもたらす可能性がある。

Anthropicが示すモデルの能力

報道によると、Anthropicは、コーディングと推論タスク向けに「Claude Mythos Preview」と名付けたモデルを訓練する中で、強力なセキュリティ用途を発見した。会社によれば、このモデルはここ数週間で数千件のゼロデイ脆弱性をすでに特定しており、その多くは重大なものだという。

Anthropicが挙げた例には、OpenBSDにある27年前のバグや、広く使われている動画ソフトウェアにある16年前の欠陥が含まれており、いずれも自動テストツールでは見つからなかったという。同社はまた、1,000件のオープンソースリポジトリに対する社内テストについても説明し、Mythos Previewが以前のモデルよりもはるかに深刻なクラッシュ結果を生み出したと述べた。

Anthropicの説明では、前世代は低位のクラッシュを多く発生させたものの、Tier 3のクラッシュは1件 בלבדだった一方、Mythos PreviewはTier 1と2で595件のクラッシュ、Tier 3と4で少数のクラッシュ、さらに完全にパッチ適用済みの10個の対象に対して完全な制御フローの乗っ取りを実現したという。Anthropicは、このモデルはそれらの侵害手法を特別に訓練されていたわけではなく、より広範なコーディング、推論、自律行動の向上からその能力が生まれたと述べた。

なぜ重要ソフトウェアが焦点なのか

Project Glasswing が重要ソフトウェア基盤に焦点を当てているのは、広く使われる基盤に欠陥があると、政府、企業、オープンソースのエコシステム全体に影響が波及するためだ。Anthropicは、最初の提携先に加えて、重要ソフトウェアを構築または保守する約40の追加組織へアクセスを拡大していると述べた。

同社はさらに、モデル利用クレジットとして最大1億ドル、オープンソースセキュリティ組織への直接寄付として400万ドルを拠出するとしている。この組み合わせは、モデル能力を示すだけでなく、デジタル経済の大部分を支えるソフトウェアを取り巻く防御的なワークフローを育てる狙いがあることを示している。

もしこのモデルが、成熟したコードベースの中で何年も生き残ってきた脆弱性を確実に識別できるなら、その価値は、ソフトウェアが最も古く、最も信頼され、そして既存ツールで包括的に監査するのが最も難しい場所で特に高くなるだろう。

より強力なAIの両義性

今回の発表は、先進的なモデルがサイバー攻撃をより高度にしてしまうのではないかという懸念が高まる中で行われた。Anthropicはこの緊張関係を率直に認め、最先端能力は今後数か月で大きく進展しうるため、防御側は追いつくために迅速に行動する必要があると主張している。

この位置づけは重要だ。Anthropicは、このモデルを単なるセキュリティ研究者向けの生産性支援ツールとして提示しているのではない。攻撃能力と防御能力の競争の一部として提示しており、遅れは攻撃者に有利に働きかねないと示している。

発表構成には、暗黙の政策的主張も含まれている。プレビュー版は限定公開で、一般提供ではなく、明確なセキュリティミッションに結びつけられている。これは、利益が大きい一方で悪用の可能性も極めて高い領域において、Anthropicが高性能システムの統制された展開経路を示そうとしていることを示唆している。

AIセキュリティ展開の新たなモデル

この取り組みは、Anthropic自身のシステムを超えても重要になる可能性がある。Project Glasswing が成功すれば、最先端ラボが機微な能力を導入する方法のひな形になるかもしれない。すなわち、限定アクセス、精査済みのパートナー、任務に限定された利用、そして成果は囲い込まず外部と共有するという前提である。

Anthropicはまた、モデルの攻撃的・防御的サイバー能力について、米国政府高官と継続的に協議してきたと述べた。この点は、いま業界を形作っている別の現実を示している。サイバーセキュリティはもはや先進AIラボの周辺的な用途ではない。こうしたシステムがどのように統治され、評価され、重要インフラに統合されるのかを測る中心的な試金石の一つになりつつある。

当面、同社の主張は明快だ。Mythosクラスの能力はソフトウェア防御を実質的に強化できると考えており、その命題をテクノロジー分野の最大級の機関と協力して証明しようとしている。

次に注目すべき点

次の段階は、見出しよりも重要になる。中核的な論点は、提携組織が実際のワークフローでAnthropicの主張を検証できるか、発見された脆弱性が効果的に修正・開示されるか、そして能力がさらに向上していく中でも同じ種類のモデルを防御用途に整合させ続けられるか、という点だ。

AI企業はこの2年間、自社システムがコーディングを変えると主張してきた。Project Glasswing が試しているのは、より狭く、より難しい命題だ。つまり、対抗者が追いつく前にリスクを意味ある形で下げるようにソフトウェアセキュリティを変革できるのか、という点である。

この記事は Fast Company の報道に基づいています。元記事を読む