Google、エージェント型 AI とコーディング向けに Gemini 3.5 Flash を発表

Google はモデル競争の焦点を「行動」へと再定義する

Google は Gemini 3.5 を発表した。これは、高度な知能と複雑なエージェント型ワークフローを実行する能力を組み合わせることを目的に設計された新しい AI モデルファミリーだという。最初のリリースは Gemini 3.5 Flash で、Google はこれを、コーディング、マルチモーダル理解、長期タスク実行向けの高速かつ最前線級のモデルとして位置付けている。同社はまた、社内利用を経て来月 Gemini 3.5 Pro の展開も予定している。

この発表の重要性は、単なる定例のバージョン更新というより、モデル競争がどこへ向かっているのかを示す点にある。Google は Gemini 3.5 を主としてチャットボットの改良として売り出しているのではない。現実の環境で、計画し、構築し、反復し、複数ステップの作業を完了できるエージェントのための実用的なエンジンとして提示している。この強調は、AI がプロンプトに答える段階から、構造化されたタスクを実行する段階へ移っているという、より大きな変化を反映している。

Flash が主力製品である理由

Google は、3.5 Flash が Flash 系列に期待される速度で動作しつつ、大型フラッグシップモデルに匹敵する知能を提供すると説明している。提供されたベンチマークによると、このモデルは Terminal-Bench 2.1、GDPval-AA、MCP Atlas を含むコーディングおよびエージェント型テストで Gemini 3.1 Pro を上回り、CharXiv Reasoning でも強いマルチモーダル推論性能を示している。さらに Google は、このモデルの出力トークン生成速度が他の最先端モデルの 4 倍だと主張している。

これらの詳細は、明確な製品仮説を支えている。最も有用なモデルは、必ずしも生の推論上限が最も高いモデルではなく、強い推論力と低レイテンシーのバランスが十分に良く、大規模にエージェントを動かせるモデルである。長期ワークフローでは、繰り返しの呼び出し、ツール使用、計画段階、修正が必要になることが多いため、このバランスは重要だ。少し賢いモデルでも、継続的にそのループを回すには遅すぎたり高すぎたりすれば、実用性は下がる。

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0が2,000時間のロボティクスデータセットを公開

X Square Robotは、実ロボットの学習データ量を減らすことを目的に、XRZero-G0と2,000時間のマルチモーダルデータセットを公開した。

Read article

エージェント型ワークフローへの推進

Google は Gemini 3.5 を、これまで開発者なら数日、監査担当者なら数週間かかっていたようなタスク向けに設計されたものだと説明し、今ではその作業を短時間で、しかも他の最先端システムの半分以下のコストで完了するのを支援できると述べている。ソースにある例としては、アプリケーション開発、コードベースの保守、財務書類の作成支援などが挙げられている。いずれの場合も、核心となる約束は一回限りの生成ではなく、複数ステップにわたる持続的な実行だ。

この枠組みは、業界全体の大きな転換と一致している。AI ベンダーはますます、自社システムを開発プラットフォーム、企業向けツール、検索製品に埋め込み、受動的な応答者ではなく能動的なオペレーターとして動かしたいと考えている。Google の発表はまさにその配信戦略を網羅している。Gemini 3.5 Flash は Gemini アプリと Search の AI Mode で利用でき、Google Antigravity や AI Studio の Gemini API、Android Studio といった開発者向けチャネルでも使えるほか、Gemini Enterprise Agent Platform や Gemini Enterprise などの企業向け製品からも提供される。

速度、到達範囲、プラットフォーム戦略

3.5 Flash を即座に広く利用可能にすることで、Google はモデルのリリースをエコシステムの勢いへと変えようとしている。消費者向け配信は利用規模とフィードバックをもたらす。開発者アクセスは、チームがエージェントやコーディングフローを試すことを可能にする。企業向けパッケージは、これらの能力を組織導入へとつなげる狙いがある。この組み合わせは、Google がこのモデルを単独製品としてではなく、消費者、開発者、企業の各層に同時に存在する必要があるインフラとして見ていることを示している。

速度への注力もこの戦略を後押ししている。エージェント型システムは、通常のワークフローの中にとどまれるだけの応答性があると感じられるほど、統合しやすくなる。モデルが強い性能を保ちながら素早く計画し行動できれば、検索、コーディングツール、業務ソフトのバックグラウンドオペレーターとしてより現実的になる。それは、主にたまに行う高負荷タスクに使われる、より遅いフラッグシップモデルとは異なる商業的な立ち位置だ。

Anthropic、AIを戦略インフラとして再定義しつつ拘束力のある監査を求める

AnthropicのDario Amodei CEOは、透明性ルールだけではもはや不十分だとして、最先端AIシステムに対する第三者の義務的監査を求めている。

Read article

今回の発表が市場に示すもの

Gemini 3.5 は、AI 競争が単なる会話の洗練ではなく、コーディング、ツール使用、エージェントの信頼性によってますます形作られている中で登場した。ベンチマークでの優位性は、いまや端末タスク、長時間の評価、実用性に結びついたマルチモーダル推論を軸に語られている。今回の発表における Google の言葉は、それを明確にしている。同社は、最前線の知能は行動と組み合わさってこそ最も価値があると主張している。

だからこそ、この発表では、より豊かなグラフィックス、現実世界への影響、個人向け AI エージェント、安全性にも触れている。与えられた限られた本文の中でも方向性は明らかだ。Google は Gemini 3.5 を、より多くを見て、より多くを推論し、より多くを実行できるソフトウェアの基盤モデルとして機能させつつ、広範な展開に足る統制性も保たせたいと考えている。そのため、このリリースの最終的な重要性は、ベンチマーク結果だけでなく、開発者や企業がその約束を信頼できる製品へと変えられるかどうかにも左右される。

AI 導入の次段階を見据えた発表

Gemini 3.5 Flash は、品質とレイテンシーのトレードオフを取り払うモデルとして導入されている。その主張が幅広い利用で成り立つかどうかは、今後の開発者や顧客による検証が必要だが、戦略メッセージは明確だ。Google は、次の AI 普及の波は、使い慣れたツールやサービスの中で複雑なタスクを高速に完了できるエージェントによって牽引されると考えている。

その意味で、Gemini 3.5 は単一の新モデルというより、製品哲学に関わるものだ。会社は、次のフロンティアを決めるのは、単なる雄弁さではなく実行力だと賭けている。もしこのモデルが、コーディングやエージェント環境で公称どおりに動作するなら、このリリースは、AI システムをより賢くするだけでなく、日々の仕事で実質的により役立つものにする競争において、Google の立場を強める可能性がある。

この記事は Google AI Blog の報道に基づいています。元の記事を読む。

Originally published on blog.google

Google、エージェント型AIを強化した Gemini 3.5 を発表