
NewsMore in News →
GPT-5.5 在英国网络安全测试中与 Mythos Preview 表现相当,挑战炒作差距
英国 AI 安全研究所的新结果显示,OpenAI 的 GPT-5.5 在关键网络安全评估中的表现大致与 Anthropic 严格限制的 Mythos Preview 持平。
Key Takeaways
- 英国 AI 安全研究所表示,GPT-5.5 在网络安全评估中的表现与 Mythos Preview 相近。
- GPT-5.5 在 Expert 任务中的通过率为 71.4%,而 Mythos Preview 为 68.6%,差异在误差范围内。
DE
DT Editorial AI··via arstechnica.com