静的分析を超えて:コードコンテキストを理解する AI

アプリケーションセキュリティは長年、シグナル対ノイズの問題に悩まされてきました。自動化された脆弱性スキャナーは膨大な量のアラートを生成し、その多くは誤検知で、開発者の注意を奪い、真の脆弱性が虚偽の警告の山に埋もれてしまう「狼少年」のダイナミクスを作成します。大規模組織のセキュリティチームは、スキャナー出力のトリアージに、実際の脆弱性修復より多くの時間を費やしています。

OpenAI は、Codex Security により、この領域に進出しました。現在リサーチプレビューで利用可能な、根本的に異なるアプローチを採用するアプリケーションセキュリティエージェントです。既知の脆弱性シグネチャと一致するパターンについてコードをスキャンする — ほとんどの既存ツールの基礎となる方法論 — のではなく、Codex Security は意図とロジックのレベルでコードを理解するように訓練された AI モデルを使用します。このシステムは、コンポーネント間の相互作用方法を含む、プロジェクトの完全なコンテキストを分析して、単一の問題のある行からではなく、コード要素間の関係から生じる脆弱性を特定します。

この違いは重要です。なぜなら、最も危険な脆弱性は、分離されている場合に明らかに間違って見えるものではなく、予期しない相互作用から発生するものだからです — 関数は 1 つのコンテキストで入力を安全に処理しますが、異なる実行パスから呼ばれると悪用可能になる、または認証チェックは予想される入力では正しく機能しますが、攻撃者がわざと調査するエッジケースでは失敗します。

Codex Security が実際にすること

OpenAI の説明に従うと、Codex Security は受動的なスキャナーではなく、エージェントとして動作します。リポジトリを取り込み、コードベースのアーキテクチャと依存関係のモデルを構築し、セキュリティプロパティについてアクティブに推論します — 潜在的な脆弱性についての仮説を生成し、コードの実際の動作に対してテストし、実際の悪用につながることが証明できない問題をフィルタリングします。

この検証ステップは、システムが従来のツールと異なると主張する場所です。潜在的に危険な関数呼び出しのすべてのインスタンスにフラグを立てる従来のスキャナーは、多くの誤検知を生成します。Codex Security のアプローチ — コントロールフロー、データフロー、およびアプリケーションロジックに対する AI の理解を使用 — は、フラグが立てられた問題がアラートとしてサーフェスされる前に、実際に到達でき、悪用できることを確認するように設計されています。目標は、より高い信頼度の検出結果と、より少ないノイズです。

真の脆弱性が特定されると、システムはレポーティングで停止しません。パッチを生成します — コードの意図された機能を保存しながら、問題を修復するように設計された実際のコード変更。パッチには、脆弱性の説明と修正の根拠が付いており、開発者が盲目的に自動化された変更を受け入れるのではなく、何が悪かったのかを理解するのに役立つように意図されています。

セキュリティエージェントカテゴリー

Codex Security は、検出を超えてアクティブな修復に進む AI 駆動のセキュリティツールの急速に出現するカテゴリ内に位置します。従来のセキュリティ製品はレポートを生成しました。より新しい AI 駆動のシステムは、ますます仕事をすることが期待されています。この転換は、部分的には最新のソフトウェアの規模によって駆動され — 組織は手動のセキュリティレビューをボトルネックにするペースでコードをデプロイします — そして部分的には、モデルが現在非自明なコードについて信頼できる推論ができるようにする AI コーディング機能の成熟によって駆動されています。

他のいくつかの企業が隣接するスペースで操業しています。GitHub Copilot はセキュリティに焦点を当てた機能を追加しました。Snyk その他の開発者セキュリティツールは、修正提案を改善するために AI を組み込んでいます。Socket、Endor Labs、Semgrep などのスタートアップは、ソフトウェアサプライチェーンセキュリティとコード分析に AI を適用しています。この領域への OpenAI の進出は、専用のセキュリティ製品で、市場機会に関する企業の評価と、そのモデルがセキュリティ関連アプリケーションに対応できるという信頼投票の両方を示しています。

リサーチプレビューの指定は重要です。これは、OpenAI がより広いリリースの前にセキュリティプロフェッショナルからのフィードバックを求めていることを示し、暗黙的にセキュリティツールは汎用 AI 製品テストが提供できない特定分野固有の検証を必要とすることを認めています。AI セキュリティエージェントが脆弱性の重大なクラスを見落とすことを発見することは、コーディングアシスタントが若干準最適なコードを書くことを発見することとは異なる障害モードです。

信頼と採用の課題

アプリケーションセキュリティ市場は新規参入企業に対して悪名高く懐疑的であり、特に AI が誤検知を減らすという主張に対して懐疑的です。セキュリティツールのすべての世代はノイズを削減することを約束しました。ほとんどは最高の場合でも段階的な改善を提供しました。高信頼度の発見が無害であることが判明した場合に被害を受けたセキュリティチームは、あらゆる新しいシステムに対して、較正されたスケプティシズムで対応するでしょう。

AI 駆動の自動パッチングにも構造的な課題があります。本番システムのコードを自動的に変更する — 真の脆弱性を修正する場合でも — ほとんどの組織が明示的に検証されたエンジニアに予約する信頼レベルを必要とします。より可能性の高い短期採用パスは、高信頼度の脆弱性報告およびパッチ提案を生成する AI で、その後人間の開発者が確認して適用するのではなく、完全に自律的な修復のためのものです。

OpenAI の広くより Codex プラットフォームは、その製品およびサードパーティ統合全体で AI コーディング機能を駆動し、Codex Security に構築するコーディング競争力の基盤を提供します。その基盤がアプリケーションセキュリティの逆境領域に十分かどうか — 目標は機能するコードを書くだけでなく、コードがどのように破られるかについて推論することです — リサーチプレビュー期間がテストするように設計されたものです。

セキュリティ業界への影響

Codex Security がその約束を実現すれば、アプリケーションセキュリティ業界への影響は重大です。既存の脆弱性スキャンツールは、AI への深い投資、ChatGPT および GitHub 統合を通じた大規模な開発者ユーザーベース、および従来のソフトウェア企業が一致できない方法で基礎となるモデルの反復を行う能力を持つプレイヤーからの競争圧力に直面しています。

シグネチャベースのスキャンからコンテキスト認識 AI 推論への転換は段階的ではありません — それは異なるパラダイムであり、OpenAI はパラダイムが変わったという明示的な議論を持つ市場に参入しました。開発者とセキュリティチームにとって、最も楽観的な結果は、脆弱性導入から修復までの時間を大幅に削減し、より多くのアラートまたはより多くの手動レビューを通じてではなく、難しい分析作業を行い、実行可能で真正である発見のみを表示する AI を通じて達成されます。

この記事は OpenAI のレポーティングに基づいています。元の記事を読む

Originally published on openai.com