Um modelo mais forte com um problema antigo ainda a reboque
O GPT-5.5 da OpenAI chegou com o tipo de manchete que normalmente define o lançamento de um modelo importante: agora ele está no topo do Artificial Analysis Intelligence Index, à frente de concorrentes líderes da Anthropic e do Google, segundo o texto-fonte fornecido. No lado do desempenho, isso torna o lançamento fácil de resumir. A parte mais difícil é que o mesmo relatório descreve uma fraqueza persistente e grave: alucinação.
A cobertura do The Decoder apresenta o GPT-5.5 como um modelo que melhora o quadro de preço-desempenho na fronteira sem resolver uma das falhas comportamentais mais teimosas dos grandes modelos de linguagem. Essa combinação está se tornando cada vez mais central para avaliar como sistemas avançados de IA devem ser julgados. Pontuações melhores e maior eficiência importam. Também importa saber se um modelo reconhece quando não sabe.
O que melhorou
A fonte diz que o GPT-5.5 alcança 60 pontos no Artificial Analysis Intelligence Index, colocando-o três pontos à frente de Claude Opus 4.7 e Gemini 3.1 Pro Preview, que empataram com 57. Ela também afirma que o modelo usa cerca de 40 por cento menos tokens do que o GPT-5.4. Essa redução de tokens é importante porque muda a economia do lançamento.
Nominalmente, o preço da API do GPT-5.5 dobrou para US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída, em comparação com o GPT-5.4. Mas o menor consumo de tokens suaviza esse aumento na prática. A fonte estima que o aumento efetivo de custo fica em cerca de 20 por cento depois de contabilizados os ganhos de eficiência. Em termos de benchmark, ela também argumenta que o GPT-5.5 pode atingir pontuações no nível de Claude Opus 4.7 com computação média por muito menos custo do que o modelo da Anthropic em configurações máximas.
Esse é o tipo de troca que os desenvolvedores realmente percebem. A corrida dos modelos de fronteira já não é apenas sobre quem lidera um ranking. Trata-se de saber se os ganhos de desempenho chegam com uso razoável de tokens, latência administrável e confiabilidade suficiente para justificar implantação em produção. Nesses termos, o GPT-5.5 parece fortalecer a posição da OpenAI.

