OpenAIがGPT-5.4 Thinkingシステムカードをリリース

GPT-5.4 Thinkingとは何ですか？

OpenAIは最新のフロンティア推論モデルGPT-5.4 Thinkingをリリースしました。同時に、モデルの能力、セーフティ評価、および制限事項を記録した詳細なシステムカードも公開しました。このリリースは、OpenAIが複雑で多段階の問題を拡張された推論チェーンを通じて解くことができるAIシステムを開発するという取り組みの別のステップです。最終的な回答をユーザーに提供する前に。

標準的な言語モデルが熟考なしにトークンごとに応答を生成するのとは異なり、GPT-5.4 Thinkingは思考の連鎖推論を使用します。これは、出力にコミットする前に問題を内部的に処理します。このアーキテクチャにより、モデルは数学的証明、複雑なコーディングタスク、科学的推論、および微妙な論理分析を以前のシステムよりも大幅に高い精度で処理できます。

OpenAIがすべてのフロンティアモデル向けに発行するシステムカードは、企業がデプロイ前にAIをどのように評価するかについて透明なビューを提供します。これは、セーフティベンチマーク、レッドチームの結果、潜在的な悪用リスク、および実装されている特定の軽減策をカバーしています。研究者と企業顧客に、新しいモデルの適切な使用例を評価するために必要な情報を提供します。

セーフティ評価とレッドチームテスト結果

GPT-5.4 Thinkingのセーフティテストは、OpenAIの準備枠組みに従い、サイバーセキュリティの脅威、生物兵器および化学兵器の実現可能性、放射線リスク、および自律的なリソース取得にわたってモデルを評価しました。システムカードはGPT-5.4 Thinkingを中程度の総合リスクカテゴリに分類しており、追加の制限をトリガーすることなく、標準的なセーフティ軽減策を使用して展開できることを意味しています。

レッドチーム評価は、ジェイルブレイク、間接的なプロンプト注入、および複数段階の敵対的操作に対するモデルの耐性をテストしました。GPT-5.4 Thinkingは以前の世代と比較して多くの攻撃ベクトルに対する耐性の向上を示しましたが、非常に高度な敵対的入力に対しては依然として完全ではありません。これは、訓練の洗練度に関係なく、すべての現在のAIシステムに適用される注意事項です。

説得力と操作能力の評価により、モデルのセーフティトレーニングがユーザーを欺いたり強制したりするために設計されたコンテンツを生成する意欲を大幅に減らすことが判明しました。OpenAIは、モデルが現実世界の結果を伴う一連のアクションを実行する可能性があるエージェント設定での動作も評価し、中程度の分類閾値の許容可能なセーフティパラメータ内でパフォーマンスが見つかりました。

ベンチマークパフォーマンスと機能

標準的な推論ベンチマークでは、GPT-5.4 Thinkingは前身と比べて有意な改善を示しています。モデルはMATHおよび競技プログラミング評価で最先端の結果を達成し、複数のドメインにわたって情報を統合する必要がある科学的推論タスクで強いパフォーマンスを示しています。物理学、化学、形式論理の大学院レベルの学術問題は、以前の世代のモデルと比較して特に強みを示しています。

拡張思考ウィンドウ（モデルが応答を出力する前に実行する内部計算の量）は以前のバージョンと比較して増加しました。これにより、GPT-5.4 Thinkingは単一ホップ推論ではなく、継続的な複数段階の分析が必要な問題に取り組むことができます。エンタープライズデプロイメントでは、これは財務モデリング、コードレビュー、研究合成タスクなどの複雑なワークフローでより信頼性の高いパフォーマンスに変わります。

これらの改善にもかかわらず、システムカードはGPT-5.4 Thinkingが完全無欠ではないことを明確に述べています。モデルは依然として事実を幻想することができ、十分に複雑な計算で算術エラーを犯し、トレーニングデータが不足しているか曖昧な場合、過度に自信のある回答を生成することができます。OpenAIは高リスクアプリケーションには人間による監督を推奨し、重要なシステムの唯一の意思決定者としてモデルを使用することに対して警告しています。

思考の連鎖の透明性

システムカードの技術的に最も重要な側面の1つは、思考の連鎖透明性の扱いです。OpenAIはモデルの推論プロセスの部分をユーザーに表示し、結論に到達するために取られた論理パスの検証を可能にするというポリシーを継続しています。この透明性は、隠れた欺瞞的な推論を構造的に難しくすることでセーフティ機能を果たし、モデル論理がユーザー自身の期待からどこに逸脱したかをユーザーが特定するのを支援することで実用的な機能を果たします。

システムカードは、目に見える思考の連鎖を完全なセーフティ保証として使用することの限界を認めています。このリリースと並行して発表された研究では、推論モデルが思考トレースで表示するものが基礎となる計算プロセスと必ずしも完全に対応していないことが判明しました。OpenAIは引き続き、目に見える推論が真の内部意思決定経路を正確に反映しているかどうかを調査しています。これは、AI解釈可能性と監督に深刻な影響を持つ問題です。

この透明性の取り組みは、推論モデルが思考を抑制または改ざんするように指示できるかどうかについてOpenAI内の広範なセーフティ研究に直接つながっています。証拠は、これが現在のアーキテクチャにとって構造的に困難であることを示唆しており、この発見は思考の連鎖監視を化粧品的な出力演劇ではなく実際の信号としての価値を強化しています。

OpenAIがGPT-5.4 Thinkingシステムカードをリリース

GPT-5.4 Thinkingとは何ですか？

セーフティ評価とレッドチームテスト結果

Related Articles

Keep Reading

OpenAIとパートナー各社、AI学習ネットワーク強化のためMRCを発表

ベンチマークパフォーマンスと機能

思考の連鎖の透明性

Singular Bankの社内AIアシスタントが示す、実務金融オートメーションの行方

企業向けAIに対するGPT-5.4 Thinkingの意味

Comments (0)

Uber、リアルタイムのマーケットプレイスデータをドライバーと乗客向けのAIガイダンスに変換