
News
Anthropic Lança Claude Sonnet 4.6 com Recordes de Benchmarks e Contexto de Um Milhão de Tokens
O modelo mid-tier mais recente da Anthropic, Sonnet 4.6, estreia com recordes em benchmarks de engenharia de software e uso de computador, além de um contexto duplicado para um milhão de tokens. O lançamento se torna o novo padrão para usuários gratuitos e profissionais.
Key Takeaways
- Sonnet 4.6 se torna o modelo padrão para usuários gratuitos e profissionais de Claude com recordes em scores SWE-Bench e OS World
- Janela de contexto dobra para 1 milhão de tokens em beta — o suficiente para codebases inteiros ou dezenas de papers de pesquisa
- Score ARC-AGI-2 de 60,4% supera a maioria dos modelos concorrentes, ficando atrás apenas de Opus 4.6, Gemini 3 Deep Think e GPT 5.2
- Lançamento segue Opus 4.6 por duas semanas, com um modelo Haiku atualizado esperado nas próximas semanas
DE
DT Editorial AI··via techcrunch.com