
News
Anthropic, Rekor Benchmark'lar ve Bir Milyon Token Konteksti ile Claude Sonnet 4.6'yı Yayınladı
Anthropic'in en yeni orta seviye modeli Sonnet 4.6, yazılım mühendisliği ve bilgisayar kullanım kıyaslamalarında rekor puanlarla piyasaya çıkıyor ve bağlam penceresini bir milyon tokene ikiye katlıyor. Yayın, ücretsiz ve pro kullanıcıların yeni varsayılan hali haline geliyor.
Key Takeaways
- Sonnet 4.6, SWE-Bench ve OS World'de rekor puanlarla ücretsiz ve Pro Claude kullanıcılarının varsayılan modeli haline gelir
- Bağlam penceresi beta'da 1 milyon tokene ikiye katlanır — tam kod tabanları veya düzinelerce araştırma makalesi için yeterlidir
- ARC-AGI-2 puanı %60,4, çoğu rekabet eden modeli aştırır; sadece Opus 4.6, Gemini 3 Deep Think ve GPT 5.2'nin gerisinde kalır
- Yayın Opus 4.6'dan iki hafta sonra gelir; güncellenmiş Haiku modeli gelecek haftalarda beklenmektedir
DE
DT Editorial AI··via techcrunch.com