Microsoftはエージェント型AIを防御セキュリティに投入している
Microsoftは、単一のモデルに依存せず、専門化したエージェントの協調的な群れに基づくAI駆動の脆弱性発見システムを構築したと述べている。このシステムはMDASH、正式にはMulti-Model Agentic Scanning Harnessと呼ばれ、100以上のエージェントを使ってソフトウェアを解析し、潜在的な欠陥について議論し、疑わしいバグが実際に悪用可能かどうかの検証を試みる。
Microsoftによれば、この手法は監査が最も難しい環境のひとつである自社の独自ソフトウェアスタック内ですでに成果を上げている。2026年5月12日のPatch Tuesdayで、同社はMDASHがネットワークおよび認証コンポーネントで発見した16件のWindows脆弱性を報告した。そのうち4件は重大と分類された。影響を受けたコンポーネントには、カーネルコンポーネントの
tcpip.sys、
ikeext.dll内のIKEv2サービス、
netlogon.dll、
dnsapi.dllが含まれていた。
対立を前提に設計されたパイプライン
Microsoftが説明するアーキテクチャは、脆弱性の件数と同じくらい重要だ。MDASHは4段階で動作する。まずソースコードを解析して攻撃対象領域をマッピングする。次に、監査担当エージェントの集合が疑わしいパターンや危険なコードパスをスキャンする。3段目では、論争担当と説明される別のエージェント群が、各発見が実際に存在し悪用可能かどうかについて賛否両論を展開する。最後に、Evidence Leaderと呼ばれるエージェントが、特定の入力を使って問題を再現しようとする。
この構造は、自動セキュリティスキャンでおなじみの問題である誤検知を解決することを意図している。セキュリティツールは、もっともらしいが価値の低いアラートを大量に生成しがちだ。専門エージェント同士に悪用試行の前に互いの主張を突き合わせさせることで、MicrosoftはMDASHを単なるノイズ増幅装置ではなく、ノイズをふるい分けるシステムとして位置づけている。
Microsoftがこの手法を特別だと考える理由
Microsoftの主張のひとつは、自社の内部コードベースが特に有用なテスト対象になるという点だ。Windows、Hyper-V、Azureはいずれも独自資産であり、公開トレーニングデータには存在しない。つまり、このシステムはオープンソースリポジトリから記憶した例をそのまま再生することはできない。閉じたコードの中で実際の問題を見つけているのであれば、それは単なる検索ではなく分析を行っていると合理的に言える。
同社はまた、このパイプラインがモデル非依存であるとも述べている。新しいモデルが利用可能になれば、システム全体を再設計することなく構成を差し替えられる。さらに専門家は、カーネルの呼び出し規約やプロセス間通信における信頼境界のような、ドメイン固有の知識を含むプラグインを追加でき、一般用途の基盤モデルには本来備わっていない技術的文脈をシステムに与えられる。
MDASHが発見したもの
同社によると、MDASHはWindowsのネットワークおよび認証スタックにおいて16件の新たな脆弱性を発見した。そのうち10件はカーネルモードに影響し、大半は認証なしでネットワーク経由で到達可能だった。こうした特性は、単なる通常のバグ一覧よりも深刻度が高いことを意味する。カーネル脆弱性はシステム全体に広範な影響を及ぼしうる一方、遠隔からのネットワーク到達性は攻撃者にとってのエクスプロイトの価値を高める。
Microsoftは、発見された欠陥のうち4件を重大と分類した。セキュリティの観点では、これがこのシステムの有用性を示す最も強い実用的な根拠だ。ベンチマークのスコアは注目を集めるかもしれないが、本番ソフトウェアの重大なバグの方が重要である。
ベンチマークでは先行、ただし注意点あり
Microsoftによると、MDASHは公開ベンチマークCyberGymで88.45%を獲得し、これまで報告された中で最高の結果を出した。これは、同社にとって新興のエージェント型セキュリティツール分野における技術的リーダーシップを示す定量的な主張となる。ただし比較はそれほど単純ではない。Microsoftはシステムを支える正確なモデルを明らかにしておらず、ベンチマークの条件が実際のソフトウェア環境の複雑さにそのまま対応するとは限らない。
それでも、この結果はより大きな潮流を裏付けている。セキュリティ研究は、単発のプロンプトから、複数のモデルやエージェントが役割分担し、互いに批評し合い、仮説を反復的に検証するオーケストレーションされたシステムへと移行しつつある。MDASHはその変化の一部であり、その設計は、実用的な自動セキュリティ作業の鍵を、コード要約だけでなく議論と検証に見いだしていることを示している。
Microsoft以外での意味
Microsoftの説明が事実なら、MDASHは企業セキュリティがどう変わりうるかの予兆を示している。大手ベンダーは、人手では包括的な監査が難しい巨大なコードベースを抱えている。継続的にスキャンし、異議を唱え、結果を検証できるエージェント型システムは、特に公開データで訓練されたモデルへの依存を強く持ちにくい独自コードの領域で、社内セキュリティプログラムの増幅装置になりうる。
運用上の含意もある。システムがモデル非依存であるため、基盤モデルの改善は迅速に積み重なる可能性がある。より優れた言語モデルがワークフローを置き換える必要はなく、タスク分配と出力検証の方法を既に知っている確立済みのパイプラインに差し込めばよい。
現時点でMicrosoftが示す最も強い証拠は具体的だ。4件の重大欠陥を含む16件のWindows脆弱性を、同社によればクローズドソースソフトウェアをまたいで推論できるというマルチエージェントシステムが発見した。Microsoftは実装の詳細をすべて明かしてはいないため、業界としてはさらなる独立検証を求めるだろう。それでもシグナルは十分に明確だ。AIによる脆弱性ハンティングは、デモ段階の目新しさから本番のセキュリティエンジニアリングへと移行しつつある。
この記事はThe Decoderの報道に基づいています。元の記事を読む。
Originally published on the-decoder.com
