OpenAI发布GPT-5.4 Thinking系统卡

什么是GPT-5.4 Thinking？

OpenAI发布了其最新的前沿推理模型GPT-5.4 Thinking，同时发布了详细的系统卡，记录了该模型的功能、安全评估和限制。该发布标志着OpenAI在开发能够通过扩展推理链处理复杂多步问题的AI系统的道路上迈出了另一步，然后才能向用户提供最终答案。

与逐个标记生成响应而没有思考的标准语言模型不同，GPT-5.4 Thinking使用思维链推理——在提交输出之前在内部解决问题。这种架构使该模型能够处理数学证明、复杂编码任务、科学推理和细致的逻辑分析，其准确性远高于早期系统。

OpenAI为所有前沿模型发布的系统卡提供了公司在部署前如何评估AI的透明视图。它涵盖安全基准、红队结果、潜在滥用风险和实施的具体缓解措施——为研究人员和企业客户提供了评估新模型适当用例所需的信息。

GPT-5.4 Thinking的安全测试遵循了OpenAI的准备框架，评估了该模型在网络安全威胁、生物和化学武器使能、放射性风险和自主资源获取方面的表现。系统卡将GPT-5.4 Thinking列为中等总体风险类别，这意味着它可以在标准安全缓解措施下进行部署，而不会触发额外的限制。

红队评估测试了该模型对越狱、间接提示注入和多步对抗性操纵的抵抗力。与前代产品相比，GPT-5.4 Thinking对许多攻击向量表现出了更强的抵抗力，尽管它对高度复杂的对抗性输入仍然不完美——这种警告适用于所有当前的AI系统，无论训练复杂度如何。

对说服力和操纵能力的评估发现，该模型的安全培训大大降低了其生成旨在欺骗或强制用户的内容的意愿。OpenAI还评估了代理设置中的行为，其中模型可能会采取具有现实世界后果的一系列行动，并发现性能在中等分类阈值的可接受安全参数范围内。

Google 正在将 AI 视频创作扩展到 Workspace 中，推出基于提示词的剪辑生成与编辑功能，以及可由自拍和录音创建的自定义头像。

在标准推理基准上，GPT-5.4 Thinking相比前代产品表现出了显著的改进。该模型在数学和竞技编程评估中达到了最先进的结果，并在需要整合多个领域信息的科学推理任务中表现出色。物理、化学和形式逻辑领域的研究生级学术问题相对于早期模型表现出了特殊的优势。

扩展思维窗口——该模型在输出响应之前执行的内部计算量——与早期版本相比已增加。这使GPT-5.4 Thinking能够处理需要持续多步分析而不是单跳推理的问题。对于企业部署，这转化为在复杂工作流中的更可靠的性能，如财务建模、代码审查和研究综合任务。

尽管有这些改进，系统卡明确指出GPT-5.4 Thinking并非无所不能。该模型仍然可能产生幻觉事实、在足够复杂的计算中犯算术错误，并在其训练数据稀疏或模棱两可时产生过度自信的答案。OpenAI建议对高风险应用进行人工监督，并警告不要在关键系统中使用该模型作为唯一决策者。

系统卡更具技术意义的方面之一是其对思维链透明度的处理。OpenAI继续其政策，向用户展示模型推理过程的部分内容，允许验证为达到结论而采取的逻辑路径。这种透明度通过使隐藏的欺骗性推理在结构上更加困难而服务于安全功能，并通过帮助用户识别模型逻辑与其自身期望的偏离点而服务于实际功能。

系统卡承认使用可见思维链作为完整安全保证的局限性。与此版本并行发布的研究发现，推理模型在其思维痕迹中显示的内容并不总是与基础计算过程完全对应。OpenAI继续调查可见推理是否准确反映真实的内部决策途径——这是一个对AI可解释性和监督具有深远影响的问题。

这种透明度工作直接连接到OpenAI内部关于推理模型是否可以被指示抑制或伪造其思维的更广泛的安全研究。证据表明这对于当前的架构在结构上很困难，这一发现强化了思维链监控作为真实信号而非化妆性输出的价值。

对于在复杂工作流中部署AI的组织，GPT-5.4 Thinking相比早期推理模型代表了意义重大的能力升级。改进的推理使其更适合于目前需要广泛人工审查的任务——合同分析、科学文献综合、复杂调试和具有细致综合要求的多文档总结。

企业API访问可通过OpenAI的标准定价层获得。扩展思维以更高的标记成本提供，反映了所涉及的额外计算，这是组织需要针对其特定用例评估质量改进的权衡。OpenAI已承诺进行持续的安全监控，并将在通过部署发现新功能或风险时更新系统卡。

该版本延续了OpenAI在能力版本发布时发布详细安全文档的模式——这是其他主要AI开发商面临越来越大压力要匹配的做法。随着推理模型成为企业AI的核心基础设施，这些评估的质量和深度将成为各行业采购和部署决策中的重要因素。

本文基于OpenAI的报道。阅读原文。

Originally published on openai.com