
News
Anthropic Merilis Claude Sonnet 4.6 dengan Benchmark Rekor dan Konteks Satu Juta Token
Model mid-tier terbaru Anthropic, Sonnet 4.6, debut dengan skor rekor dalam benchmark rekayasa perangkat lunak dan penggunaan komputer, ditambah konteks window yang berlipat ganda menjadi satu juta token. Rilis ini menjadi default baru untuk pengguna gratis dan pro.
Key Takeaways
- Sonnet 4.6 menjadi model default untuk pengguna Claude gratis dan pro dengan skor SWE-Bench dan OS World rekor
- Konteks window menggandakan menjadi 1 juta token dalam beta—cukup untuk seluruh codebase atau puluhan makalah penelitian
- Skor ARC-AGI-2 60,4% mengungguli sebagian besar model kompetitor, hanya tertinggal dari Opus 4.6, Gemini 3 Deep Think, dan GPT 5.2
- Rilis mengikuti Opus 4.6 selang dua minggu, dengan model Haiku yang diperbarui diharapkan dalam beberapa minggu ke depan
DE
DT Editorial AI··via techcrunch.com