
News
Anthropic、ベンチマーク記録達成とクエスチョンマーク100万トークンコンテキストで Claude Sonnet 4.6をリリース
Anthropicの最新ミッドティアモデルであるSonnet 4.6は、ソフトウェアエンジニアリングとコンピュータ使用ベンチマークで記録的なスコアを達成し、コンテキストウィンドウを200万トークンに倍増させた状態でデビューします。このリリースは無料およびプロユーザーの新しいデフォルトとなります。
Key Takeaways
- Sonnet 4.6は、SWE-BenchとOS Worldスコアで記録を樹立した無料およびプロClaudeユーザーのデフォルトモデルになります
- コンテキストウィンドウがベータで100万トークンに倍増—完全なコードベースまたは数十の研究論文に十分
- 60.4%のARC-AGI-2スコアは、Opus 4.6、Gemini 3 Deep Think、GPT 5.2に次いで、ほとんどの競合モデルを上回っています
- リリースはOpus 4.6から2週間後に続き、更新されたHaikuモデルは来週予定されています
DE
DT Editorial AI··via techcrunch.com