CircleからCommerceへ

GoogleがCircle to Searchを2024年1月に導入したとき、それは永続的な問題の優雅なソリューションとしてデビューしました:電話画面に見えるものを検索する際の摩擦。スクリーンショットを撮り、ブラウザに切り替えて、Google Lensを開き、スクリーンショットをアップロードする代わりに、Circle to Searchはユーザーがホームボタンを長押しして、検索したいもの(テキスト、画像、製品、顔)の周りに円を描くだけで、彼らが居たアプリを離れることなく検索できるようにしました。この機能はその後、数千万台のAndroidデバイスに拡大し、Googleはそれを過去2年間に出荷した最も成功したAI搭載機能の1つとしています。

現在、GoogleはCircle to Searchの機能を深化させており、その有用性と偶然にもその商業的可能性を大幅に拡張します。一連の新しいアップデートが、Googleが視覚インテリジェンス機能と呼ぶものを追加します:画像内の特定のファッションアイテム、ホームデコア製品、および消費財を認識および検索する能力 — そしてユーザーがこれらのアイテムがどこで売られているか、どの価格で、どの構成で見つけることができるようにする買い物可能な結果を表示します。視覚検索で完全な画像を見る新しい能力と組み合わされて — シーン内のオブジェクト間の空間および文脈的な関係を理解して — アップデートはCircle to Searchが何ができるかの大幅な拡張を表しています。

ファッション検索:主要なユースケース

ファッション識別機能は新機能の中で最も直接ユーザー向けです。これを使用して、ユーザーはInstagramの投稿、Pinterestのピン、ウェブサイト画像、またはカメラで撮った写真の中で衣服の周りに円を描いて、特定のアイテム(それが認識可能な製品である場合)を識別する結果、複数の小売業者からの視覚的に類似したアイテム、および現在の価格と可用性に関する情報を受け取ることができます。このシステムはGoogleの視覚埋め込みモデル(Google Lensの製品検索の基礎となるのと同じテクノロジー)を使用していますが、Circle to Search インターフェースにネイティブに統合され、部分的なビュー、異なるライティング条件、および部分的に隠れているアイテムを処理するように拡張されています。

実用的なユースケースは、ファッション意識の高い消費者がすぐに認識するものです:誰かが身に着けているものを見て、それまたは同様のものを見つけたいという欲望、そしてテキスト検索用語で説明しようとする退屈なプロセスに直面しています。ファッションのためのCircle to Search検索はこの摩擦を完全に排除します。識別の正確性はアイテムがどの程度独特であるかによって異なります — 認識可能なブランディングまたは詳細を持つ非常に具体的なデザイナーピースはより簡単に識別されます汎用的な単色のTシャツより — しかしGoogleが数十億の製品画像全体にわたる広範なトレーニングデータは、システムに広い認識ベースを与えます。

ホームデコアと製品認識

同じ視覚認識機能はホームデコアと消費者向けエレクトロニクスまで拡張され、ユーザーが頻繁に写真でアイテムに遭遇する — 編集コンテンツ、ソーシャルメディアの投稿、不動産のリスティング — そしてそれらを購入したいカテゴリーです。部屋の写真から特定のランプ、特定のラグパターン、またはテレビのモデルを識別することは、これまで画像検索システムにとって難しい問題でした。これらのアイテムはしばしば角度で表示され、異なるライティングの下で、正確な識別を困難にする部分的なビューで表示されるためです。

Googleの更新されたモデルは、孤立した製品画像として照合しようとする代わりに、シーンコンテキスト内のオブジェクトについて推論することで、これらのシナリオをより優雅に処理します。システムは、部屋の写真の背景にあるオブジェクトが家具または装飾である可能性が高いことを理解し、この事前情報を認識プロセスに組み込み、正確な識別のためのきれいなカタログ画像を必要とする代わりに、表示角度とライティング条件を考慮した結果を表示します。

商業的側面

商業的側面を認めずにこれらのアップデートを分析することは素朴です。Googleのコア広告ビジネスはユーザーの意図を商業的機会と結ぶことに依存し、視覚検索はその接続のための巨大な未開発表面領域を表しています。ユーザーが画像内の製品を円で囲むと、それはほとんどのテキスト検索よりも具体的で実行可能な購買意図の表現です。その意図から買い物可能な結果をすぐに表示し、それをユーザーがすでに関与しているアプリ内で行うことができることは、広告とコマース観点から非常に価値があります。

Google Shoppingは長年にわたって重要な収益貢献者であり、Circle to Searchとショッピング結果の統合は本質的にAndroidデバイス上の任意の画像を潜在的なコマースタッチポイントに変えます。会社はこれをユーザーのメリットとして慎重に提示しています — あなたが欲しいものを簡単に見つける — そしてほとんどのユースケースでは、そのフレーミングは正確です。しかし、ユーザーの便利さとGoogleの商業的利益との調整は偶然ではなく、コマースを最も直接的に可能にする視覚AIの改善がGoogleの製品発表で最も目立つ位置を受けているものであることは注目する価値があります。

今後を展望

Circle to SearchアップデートはGoogleのデバイス上AI機能のより広い進化の一部です。Gemini Nanoおよび関連モデルがモバイルハードウェア上で直接ますます洗練されたタスクを実行できるようになるにつれて、以前はデータをGoogleのサーバーに送信する必要があった機能をローカルで実行でき、レイテンシーとプライバシーに影響を与えます。GoogleはCircle to Searchの視覚処理の一部がモデルの効率が向上するにつれてデバイス上実行に向かうことを示唆し、これは機能をオフラインで動作させ、視覚検索に関連するデータ転送を減らすことを可能にするでしょう。今のところ、クラウドインテリジェンスとデバイス上実行の組み合わせは、Googleのトレーニングデータと基盤インフラストラクチャのスケールへのアクセスなしに競合他社が比較することが難しい能力プロファイルをCircle to Searchに与えます。

この記事はGoogle AI Blogの報道に基づいています。元の記事を読む