新たなデータ供給企業は、ゲーム世界が現実世界向け機械知能を鍛えられると賭けている

Origin Lab は、いわゆるワールドモデルを開発する AI ラボとビデオゲーム企業を結ぶマーケットプレイスを構築するため、800 万ドルのシードラウンドを調達した。発想はシンプルだが、潜在的には重要だ。AI システムがテキストの領域を超えてロボティクス、シミュレーション、物理推論へ進むにつれ、物体、空間、動きがどのように振る舞うかを捉えた学習データが必要になる。Origin Lab は、その有用な構造化データの多くがすでにビデオゲーム産業の中に存在していると主張する。

このラウンドは Lightspeed Ventures が主導し、SV Angel、Eniac、Seven Stars、FPV が参加したほか、Twitch 共同創業者 Kevin Lin と Cruise 創業者 Kyle Vogt もエンジェル投資家として支援した。この投資家リストが重要なのは、この会社が単なるニッチなコンテンツライセンス事業ではなく、成長する AI サプライチェーンのインフラとして見られていることを示しているからだ。

ワールドモデル構築者に異なるデータが必要な理由

大規模言語モデルは、豊富なインターネットテキストの上に築かれてきた。一方で、物理環境を推論するために設計されたシステムには、同じように扱いやすいデータの貯蔵庫がない。Origin Lab の共同創業者 Anne-Margot Rodde によれば、現在開発されている AI システムは、物理世界がどう動くのか、物事がどう移動するのかを理解する必要がある。そこで生じるボトルネックは、テキスト補完ではなく空間推論に役立つ、高品質で権利関係が明確なデータだ。

ビデオゲームは魅力的な供給源だ。なぜなら、デジタル環境、物体、相互作用、移動パターンが含まれており、それらをレンダリングしたり記録したり、モデル向けの形式へ変換したりできるからだ。Origin Lab の整理では、業界は価値ある資産を持っているが、それを AI ラボに効率よくパッケージ化し、ライセンス提供するためのインフラが不足している。同社はその橋渡し役となり、既存のゲーム資産をレンダリングされたシーンから自動プレイ映像まで含む学習データに変えると述べている。

ビジネスの成否はライセンスとデータ品質にかかる

この概念は完全に新しいわけではない。AI ラボは以前からゲーム映像やゲームに似たシミュレーション環境に関心を示してきた。足りなかったのは、法的なアクセスと使いやすさの両方の問題を解決できる堅牢な商業レイヤーだ。元記事は、ライセンスとデータ品質の問題が広範な利用をしばしば妨げてきたと指摘している。そこが Origin Lab の差別化ポイントだ。

AI ラボにとって、ライセンスされた入力は、スクレイピングされたり非公式に調達されたりしたデータをめぐる法的曖昧さを減らす。ゲーム会社にとっては、すでに作成したデジタル資産から新たな収益源を得られる。プラットフォームが機能すれば、販売とエンゲージメントで収益化されてきたコンテンツを、モデル学習の二次市場に変えられるかもしれない。

このため、同社のタイミングも重要だ。記事では、OpenAI が 2024 年後半に、Sora の初期版がビデオゲームや配信者の映像を再現しているように見えたことで批判を受けたと指摘している。つまり、学習データの出所が商業的にも評判面でも敏感になっていたということだ。Origin Lab は、権利を取得し、データを標準化し、信頼できる供給に対価を払えるラボへ販売する、よりクリーンな経路を提供している。

データベンダーが戦略的インフラになりつつある

Lightspeed の Faraz Fatemi は、この機会を他の AI 隣接ビジネスでもおなじみの言葉で表現した。大手ラボは資金が豊富で、データは依然としてボトルネックだということだ。これは、評価、ラベリング、データ運用を提供する企業で投資家が見てきた成長ストーリーと重なる。Origin Lab の賭けは、ワールドモデルの開発が、シミュレーション級で動きの多いデータセットに特化した同様の供給者カテゴリを生み出すというものだ。

この変化の重要性は、一社のスタートアップにとどまらない。AI 経済が、独自データセットや構造化データセットがモデルアーキテクチャと同じくらい戦略的な価値を持つ段階に入っていることを示唆している。その環境では、入手が難しいデータを調達し、合法化し、運用可能にする企業が、最先端モデルを自ら構築しなくても強力な仲介者になりうる。

次の AI 戦場について何を示しているか

Origin Lab の提案は、AI の優先事項がより広く転換していることを映している。問われているのは、もはやテキスト生成をどう拡張するかだけではない。環境を知覚し、物体について推論し、最終的には物理世界と相互作用できるシステムをどう作るかが、ますます重要になっている。これにより、市場は新しい種類のデータへ、そしてそれを解き放てるビジネスへ向かう。

ゲーム資産がワールドモデルの基礎入力になるかどうかは、まだ証明されていない。合成環境は有用だが現実世界そのものではなく、ゲーム由来データがロボティクスや embodied intelligence の実用アプリケーションへどの程度転移するかは、ラボが判断しなければならない。それでも、このスタートアップは本物の制約を狙っている。ワールドモデル研究が加速すれば、合法的に入手され、技術的に適応可能なデータセットへの需要もそれに伴って高まる可能性が高い。

その意味で Origin Lab は、単なるライセンスの小さな賭け以上の存在だ。AI サプライチェーンがいかに専門化しつつあるかを示す初期の兆候である。業界の次の段階で重要になる企業は、モデルを訓練する側だけではないかもしれない。モデルに何を見せてよいかを決める側でもあるだろう。

この記事は TechCrunch の報道に基づいています。元記事を読む

Originally published on techcrunch.com