Google の Gemma 4 がオンデバイスのエージェント型 AI をスマートフォンへ

Google はより多くの AI 処理をデバイス自体へ移している

The Decoder によると、Google の最新の Gemma 4 リリースは、クラウドに依存するのではなく、スマートフォンやその他のハードウェア上で直接動作するローカル AI への、より野心的な取り組みを示している。この新しいオープンソースのモデルファミリーは、テキスト、画像、音声を完全にオンデバイスで処理でき、さらに Wikipedia へのアクセス、インタラクティブな地図、QR コード生成といった内蔵の “agent skills” を通じてツールも利用できる。

この組み合わせが重要なのは、モバイル AI の実用的な意味を変えるからだ。多くの消費者向けシステムはすでにアシスタントを名乗っているが、その中核的な処理は今なおリモートサーバーに依存していることが多い。Gemma 4 は異なる位置づけにある。魅力は速度や利便性だけではない。データをデバイス内に保持しながら、より幅広い操作を可能にする点にある。

このタイミングは、業界全体の大きな流れにも合っている。モデルがより効率的になり、モバイルチップが進化するにつれ、各社はより多くの知能をエッジハードウェアへ移そうとしている。それにより、遅延を減らし、サーバーコストを下げ、プライバシーに関する主張の説得力も高められる。Google は今、その技術的な方向性を、開発者プラットフォームと消費者向けの配信チャネルの両方へ同時に変えようとしている。

小型モデルは主流のスマートフォンを狙う

The Decoder によれば、Gemma 4 は 4 つのバリアントで提供される。そのうち E2B と E4B の 2 つは、スマートフォン向けに特化して作られている。“E” は effective parameters を指し、推論時に有効なパラメータのことだ。量子化後、E2B はデバイス上で約 1.3 GB を占め、E4B は約 2.5 GB を必要とする。

これらの容量が注目に値するのは、単なる高級ハードウェア向けの見せ物ではなく、実用的な展開戦略を示しているからだ。レポートによれば、E2B と E4B はそれぞれ 6 GB と 8 GB の RAM を搭載したスマートフォンで動作できる。これが日常利用で成り立つなら、対応可能なインストールベースを大きく広げ、ローカルなマルチモーダル AI をフラッグシップ端末への依存から少し解放することになる。

Google はまた、スマートフォン向けバリアントは前世代より最大 4 倍高速に動作し、バッテリー消費を最大 60% 削減するとしている。The Decoder が引用した Arm 自身のベンチマークでは、新しい Arm チップでさらに大きな処理性能向上が示されている。実際の体験は端末によって異なるが、メッセージは明確だ。モデルアーキテクチャとハードウェア最適化は、いまや単純なサイズと同じくらい重要になりつつある。

Google と OpenAI、中国関連のAI悪用作戦をそれぞれ公表

Google はAIを利用したとされる詐欺ネットワークをめぐって提訴し、OpenAI は米国の議論やインフラをめぐる言説を標的にした中国関連の影響工作クラスター2件を妨害したと発表した。

Read article

より大きなポイントは、クラウドなしでのエージェント能力だ

このリリースを単なる効率化アップデートと分けるのは、ツール利用への重視だ。Gemma 4 は、単にコンパクトなマルチモーダルモデルとして説明されているわけではない。組み込みの skills を通じて特定のツールを自律的に呼び出せるエージェント型システムとして位置づけられている。実際には、ローカルで動作するモデルは、プロンプトに対して質問へ答えるだけではなく、情報を取得したり、地図を扱ったり、リモートサービスへやり取りを送信せずに有用な出力を生成したりできるということだ。

このアーキテクチャには戦略的な含意がある。オンデバイスのエージェントは、機能性とプライバシーの別のバランスを約束する。モデル、ユーザー入力、ツールのオーケストレーションがすべてユーザーの管理下にあるハードウェア上で完結すれば、企業はよりプライベートな AI 体験を提供しつつ、より豊かなワークフローも支援できる。

また、カスタマイズへの道も開く。The Decoder は、開発者が GitHub を通じてカスタム skills を作成し共有できると報じている。これは Google が単にモデルファミリーを出荷しているのではなく、持ち運び可能なローカル AI 行動の周囲にエコシステムを育てようとしていることを示唆する。

Google はオープンな公開と広い配布を組み合わせている

Gemma 4 は Apache 2.0 ライセンスで公開されており、The Decoder はこれを商用利用に友好的だと説明している。これは重要だ。ライセンスによって、モデルファミリーが本格的な開発基盤になるのか、それとも主に研究上の好奇心にとどまるのかが決まるからだ。寛容なライセンスは、実験、改変、商用展開のハードルを下げる。

Google はまた、無料の Google AI Edge Gallery アプリを通じて Android と iOS に体験を配布している。The Decoder によると、Gemma 4 の公開以降、このアプリは Apple の iOS App Store で最もダウンロードされた無料の生産性アプリの中で 4 位まで上昇し、Claude、Gemini、ChatGPT に次いでいる。順位は変動するにしても、このデータはローカル AI 体験への初期の消費者関心がかなり強いことを示している。

同レポートは、Gemma 4 が Google の独自モデル Gemini 3 と同じ研究基盤の上に構築されており、スマートフォン向けバリアントが Android 上の Gemini Nano 4 の基盤になるとも伝えている。このつながりは重要だ。Google がオープンモデルとプロプライエタリモデルの両系統を同じ大きなスタックの一部として扱い、Gemma を開発者プラットフォームであると同時にモバイル展開の試験場として位置づけていることを示している。

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0が2,000時間のロボティクスデータセットを公開

X Square Robotは、実ロボットの学習データ量を減らすことを目的に、XRZero-G0と2,000時間のマルチモーダルデータセットを公開した。

Read article

このリリースが AI プラットフォーム競争で重要な理由

AI 市場はますます、フロンティアクラウドモデル、企業導入、開発者エコシステム、そしてデバイスネイティブの知能という複数の重なり合う競争に分かれつつある。Gemma 4 は Google に、後者 2 つのカテゴリでより強い立場を与える。オープンウェイト、モバイル最適化、ツール利用、消費者向けアプリを組み合わせることで、同社はローカル AI を開発者にも最終ユーザーにもより実感しやすいものにしようとしている。

この動きは、競争上の必然性も反映している。AI がスマートフォンや他の個人デバイスの標準レイヤーになるなら、効率的なローカルモデルとその周辺の開発者体験を支配する企業が重要な優位を得る。クラウドアクセスは大規模なワークロードでは引き続き中心であり続けるが、すべてのやり取りにデータセンター規模の応答が必要なわけではない。

したがって Gemma 4 は、よりハイブリッドな未来を示している。より大きなモデルや広い計算資源を必要とするため、遠隔のまま残る AI タスクもある。一方で、他のタスクはますます、ユーザーがすでにいる場所、つまり端末上、OS の中、そして機微な個人データの近くで実行されるようになる。

Google にとって、このリリースはその未来を早期に形作ろうとする試みだ。開発者にとっては、より実用的なローカル基盤を提供する。ユーザーにとっては、「スマートフォン上の AI」が、クラウドへのブランド化されたショートカット以上の、より文字通りの意味を持つようになることを示唆している。

この記事は The Decoder の報道に基づいています。元記事を読む。

Originally published on the-decoder.com

Google、Gemma 4 と組み込みエージェント機能でオンデバイス AI をさらに推進