
NewsMore in News →
GPT-5.5 égalise Mythos Preview dans les tests britanniques de cybersécurité, remettant en cause l’écart de battage
De nouveaux résultats de l’Institute of AI Security du Royaume-Uni suggèrent que GPT-5.5 d’OpenAI atteint à peu près le même niveau que Mythos Preview d’Anthropic, très restreint, sur des évaluations clés de cybersécurité.
Key Takeaways
- L’Institute of AI Security du Royaume-Uni indique que GPT-5.5 a atteint un niveau de performance similaire à Mythos Preview dans les évaluations cyber.
- GPT-5.5 a réussi 71.4 % des tâches expert, contre 68.6 % pour Mythos Preview, dans la marge d’erreur.
DE
DT Editorial AI··via arstechnica.com