
NewsMore in News →
GPT-5.5 iguala a Mythos Preview en pruebas británicas de ciberseguridad, desafiando la brecha del bombo
Nuevos resultados del Instituto de Seguridad de IA del Reino Unido sugieren que GPT-5.5 de OpenAI rinde aproximadamente al mismo nivel que Mythos Preview de Anthropic, muy restringido, en evaluaciones clave de ciberseguridad.
Key Takeaways
- El Instituto de Seguridad de IA del Reino Unido dice que GPT-5.5 alcanzó un nivel de rendimiento similar al de Mythos Preview en evaluaciones cibernéticas.
- GPT-5.5 aprobó el 71.4% de las tareas expertas, frente al 68.6% de Mythos Preview, dentro del margen de error.
DE
DT Editorial AI··via arstechnica.com