Anthropic がコンピュータ操作 AI への動きを加速

Claude ファミリーのモデルを開発している AI 安全企業 Anthropic は、コンピュータインターフェースを自律的にナビゲート・操作できる AI エージェントの構築に注力するスタートアップ Vercept を買収しました。TechCrunch が確認したこの買収は、Vercept の共同創業者の一人を正式に採用した Meta の動きからわずか数週間後に行われており、AI 業界全体で繰り広げられている激しい人材争奪戦を浮き彫りにしています。

Vercept は、人間のユーザーと同じように AI システムがソフトウェアアプリケーションと相互作用できるようにする技術を開発していました。ボタンをクリックし、フォームに入力し、メニューをナビゲートし、異なるアプリケーション間で複数ステップのワークフローを実行します。「コンピュータ操作」として広く知られているこの機能は、人工知能の中で最も競争が激しい領域の一つになっています。

なぜコンピュータ操作が重要なのか

AI エージェントがコンピュータを操作する能力は、膨大な範囲の実用的なアプリケーションを開く可能性があります。ソフトウェアごとにカスタム API インテグレーションを必要とするのではなく、コンピュータ操作エージェントは理論的には、グラフィカルインターフェースを持つあらゆるアプリケーションで機能することができます。これは、同じエージェントが人間のアシスタントのようにフライトを予約し、スプレッドシートを更新し、経費報告書を作成し、フォローアップメールを送信するなど、既存のソフトウェアと対話することで実現できることを意味します。

Anthropic は 2024 年後半に、Claude モデルのコンピュータ操作機能を初めてデモンストレーションしました。Claude がデスクトップ環境をナビゲートし、Web ブラウザを使用し、複雑な複数ステップのタスクを実行する様子を示した研究プレビューを公開しました。この機能は、これまで大規模言語モデルを定義していたテキストイン・テキストアウトパラダイムからの大きな転換を示しています。

それ以来、同社はその機能の改善を継続しており、Vercept の買収は Anthropic がコンピュータ操作を製品提供の中核部分にするために力を入れていることを示唆しています。業界アナリストは、これを AI エージェント(単なるチャットボットだけではなく)が次の企業採用の波を牽引するという戦略的な賭けとみています。

この取引の背景にある人材争奪戦

買収を取り巻く状況は、AI 人材をめぐる競争の激しさを明らかにしています。Meta は Vercept の共同創業者の少なくとも一人の採用に成功しており、この動きはおそらく他の競合他社が同様の動きをできる前に Anthropic が残りのチームと技術を買収する決定を加速させたと思われます。

このアクイハイアと防衛的買収のパターンは AI セクターでますます一般的になっています。Google、Microsoft、Amazon、Meta はすべて最近数ヶ月間で AI 人材を確保するための重要な動きを行っており、推論、エージェントアーキテクチャ、マルチモーダル AI などの領域で専門知識を持つ小チームに対してプレミアム価格を支払うことが多いです。

100 億ドル以上の資金を調達し、約 600 億ドルの評価額を持つ Anthropic にとって、Vercept 買収は相対的に控えめな投資であり、大きな戦略的リターンをもたらす可能性があります。同社は企業顧客向けの AI エージェント機能の主要プロバイダーとして自らを位置づけており、コンピュータ操作はそのビジョンの重要な要素です。

競争環境

Anthropic はコンピュータ操作 AI エージェントを追求している唯一の企業とはほど遠いです。OpenAI は Operator プロダクトを通じて独自のエージェント機能を開発しており、これはユーザーに代わって Web ブラウザでタスクを実行できます。Google は Gemini モデルにエージェント機能を組み込んでおり、Microsoft は Office スイート全体に Copilot エージェントを統合しています。

様々なアプローチを区別するのは、信頼性と安全性です。コンピュータ操作エージェントはエラーから優雅に回復でき、意図しない行動を回避し、機密情報を適切に処理できる必要があります。誤ってファイルを削除したり、不正な購入をしたり、プライベートデータを公開したりするエージェントは、まったくエージェントがないより悪いでしょう。

Anthropic はセーフティを差別化要因として強調し、コンピュータ操作機能に複数のレイヤーの確認と監視を実装しています。Vercept チームの堅牢なコンピュータ操作システムを構築する専門知識は、これらのセーフティメカニズムを強化し、エージェントが確実に処理できるタスクの範囲を拡大することが期待されています。

  • コンピュータ操作エージェントはグラフィカルインターフェースを通じてあらゆるソフトウェアと相互作用でき、カスタム API インテグレーションの必要性を排除します
  • 企業顧客は特に、異なるアプリケーション間で複数ステップのワークフローを自動化できるエージェントに関心があります
  • セーフティと信頼性は引き続き重要な差別化要因であり、コンピュータ操作エージェントのエラーは現実世界の結果をもたらす可能性があります
  • この買収は、専門知識をめぐる競争が激化するにつれて AI ラボが防衛的な人材の動きをするというパターンに従っています

エンタープライズ AI にとってこれが意味するもの

Vercept 買収は、AI 業界が会話型チャットボットから脱却し、デジタル世界で意味のある行動を起こせるエージェントへと急速に移行していることを示唆しています。企業顧客にとって、この変化は、以前は高額なカスタムソフトウェア開発なしには不可能だった自動化機能をアンロックすることを約束しています。

金融アナリストは、AI エージェントソフトウェアの市場が 2028 年までに 500 億ドルに達する可能性があると推定しており、コンピュータ操作機能がその総額の大きなシェアを占めると見ています。ビジネスがますます複雑なワークフローの自動化を求めるにつれて、信頼性が高く、安全で、能力のあるエージェントを提供できる企業は莫大な価値を獲得するでしょう。

Anthropic の戦略は、最も能力があり信頼できるエージェントプラットフォームを構築することであると思われます。フロンティア言語モデルをコンピュータ操作のような専門的な機能と組み合わせています。Vercept 買収はその方向への最新のステップであり、最後になる可能性は低いです。

この記事は TechCrunch のレポートに基づいています。オリジナル記事を読む