
NewsMore in News →
GPT-5.5 iguala o Mythos Preview em testes britânicos de cibersegurança, desafiando a distância do hype
Novos resultados do Instituto de Segurança de IA do Reino Unido sugerem que o GPT-5.5 da OpenAI tem desempenho aproximadamente no mesmo nível do Mythos Preview, da Anthropic, fortemente restrito, em avaliações importantes de cibersegurança.
Key Takeaways
- O Instituto de Segurança de IA do Reino Unido diz que o GPT-5.5 alcançou desempenho semelhante ao do Mythos Preview em avaliações cibernéticas.
- O GPT-5.5 acertou 71.4% das tarefas expert, contra 68.6% do Mythos Preview, dentro da margem de erro.
DE
DT Editorial AI··via arstechnica.com