GPT-5.4 Thinkingとは何ですか?
OpenAIは最新のフロンティア推論モデルGPT-5.4 Thinkingをリリースしました。同時に、モデルの能力、セーフティ評価、および制限事項を記録した詳細なシステムカードも公開しました。このリリースは、OpenAIが複雑で多段階の問題を拡張された推論チェーンを通じて解くことができるAIシステムを開発するという取り組みの別のステップです。最終的な回答をユーザーに提供する前に。
標準的な言語モデルが熟考なしにトークンごとに応答を生成するのとは異なり、GPT-5.4 Thinkingは思考の連鎖推論を使用します。これは、出力にコミットする前に問題を内部的に処理します。このアーキテクチャにより、モデルは数学的証明、複雑なコーディングタスク、科学的推論、および微妙な論理分析を以前のシステムよりも大幅に高い精度で処理できます。
OpenAIがすべてのフロンティアモデル向けに発行するシステムカードは、企業がデプロイ前にAIをどのように評価するかについて透明なビューを提供します。これは、セーフティベンチマーク、レッドチームの結果、潜在的な悪用リスク、および実装されている特定の軽減策をカバーしています。研究者と企業顧客に、新しいモデルの適切な使用例を評価するために必要な情報を提供します。
セーフティ評価とレッドチームテスト結果
GPT-5.4 Thinkingのセーフティテストは、OpenAIの準備枠組みに従い、サイバーセキュリティの脅威、生物兵器および化学兵器の実現可能性、放射線リスク、および自律的なリソース取得にわたってモデルを評価しました。システムカードはGPT-5.4 Thinkingを中程度の総合リスクカテゴリに分類しており、追加の制限をトリガーすることなく、標準的なセーフティ軽減策を使用して展開できることを意味しています。
レッドチーム評価は、ジェイルブレイク、間接的なプロンプト注入、および複数段階の敵対的操作に対するモデルの耐性をテストしました。GPT-5.4 Thinkingは以前の世代と比較して多くの攻撃ベクトルに対する耐性の向上を示しましたが、非常に高度な敵対的入力に対しては依然として完全ではありません。これは、訓練の洗練度に関係なく、すべての現在のAIシステムに適用される注意事項です。
説得力と操作能力の評価により、モデルのセーフティトレーニングがユーザーを欺いたり強制したりするために設計されたコンテンツを生成する意欲を大幅に減らすことが判明しました。OpenAIは、モデルが現実世界の結果を伴う一連のアクションを実行する可能性があるエージェント設定での動作も評価し、中程度の分類閾値の許容可能なセーフティパラメータ内でパフォーマンスが見つかりました。



