Google Translate が AI コンテキストと文化的理解を獲得

本当に理解する翻訳

Google Translate は、その歴史上の様々な時点で 1 日あたり 1000 億以上の単語を処理してきており、人類の歴史で最も使用されている言語ツールの 1 つです。しかし、その巨大な規模にもかかわらず、ユーザーは一貫して同じ制限を特定してきました。ツールは単語を翻訳しますが、意味を翻訳することに失敗することが多いのです。イディオムは文字通りに出てきて、文化的参照は不恰好に聞こえ、テキストのレジスター（正式、カジュアル、専門的、親密）は言語間の遷移でしばしば失われます。Google Translate への新しい AI 搭載アップデートのセットは、これらの制限に直接対処するように設計されており、大規模言語モデル技術を使用して、統計翻訳が達成したことのないコンテキスト理解のレイヤーを追加しています。

Google が発表したアップデートは、企業がコンテキスト対応翻訳と呼ぶものに焦点を当てています。これは、Translate が単にソーステキストをターゲットテキストに単語ごとにマップするのではなく、目的地言語でレンダリングする前に段落の完全な意味を理解しようとするモードです。これは、イディオムを認識し、それらを文字通りの意味ではなく機能的な同等物としてレンダリングすること、ソーステキストの形式レベルを検出し翻訳で一致させること、および有意に異なる意味合いで複数の有効な翻訳が存在する曖昧な段落にフラグを付けることを含みます。

テクノロジーの仕組み

Google が 2016 年以来使用している神経機械翻訳モデルを含む従来の機械翻訳システムは、基本的にはシーケンスツーシーケンスモデルとして動作します。それらは数十億の整列された例からソース言語とターゲット言語のテキスト間の統計パターンを学習し、それらのパターンを使用してトークン単位で翻訳を生成します。このアプローチは流暢な出力を生成しますが、単語またはフレーズの意味が即座の文を超えて拡張されるコンテキストに依存する場合、固有の制限があります。

新しいコンテキスト AI レイヤーは異なる方法で動作します。翻訳を生成する前に、ソーステキストを大規模言語モデルを通じて実行し、段落の意味表現を構築します。トピック、話者の明らかな意図、感情的なレジスター、および特定の参考文献または言い回しの選択によって暗示される文化的背景を識別します。その意味表現は、追加の調整信号として翻訳レイヤーに渡され、文法構造だけではなく意味を保持する翻訳に向けて出力を導きます。

1 つの具体的な機能は、Google が文化的適応を備えた翻訳メモリと呼ぶものです。ソーステキストに文化的に特定の参照が含まれている場合、スポーツメタファー、政治的言及、食べ物の参照などがある場合、システムは説明的なメモを使用して直接翻訳するか、ターゲット言語で同じ文化的共鳴を持つ同等の参照に適応させることができます。ユーザーは好みのモードを選択できます。直接メモ付きアプローチは正式な背景や教育的背景に役立ち、文化的適応アプローチは自然な会話に適しています。

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0が2,000時間のロボティクスデータセットを公開

X Square Robotは、実ロボットの学習データ量を減らすことを目的に、XRZero-G0と2,000時間のマルチモーダルデータセットを公開した。

Read article

実践的な応用

改善は、いくつかの具体的なユースケースで最も直ちに影響を与える可能性があります。言語障壁を越えたビジネスコミュニケーションは 1 つです。専門的なメールと文書は、しばしば形式レベル（正式さ、尊敬、直接性）の信号を含みます。これは受信方法にとって重要であり、これらの信号を誤って取得すると、実際の結果をもたらす誤解が生じる可能性があります。法的および医療翻訳は、文字通りの翻訳と有意義な翻訳の区別が非常に重要である可能性がある別の領域です。

言語学習者にとって、アップデートはユーティリティの新しい側面を提供します。テキストが別の言語で何を言っているかを単に示すのではなく、コンテキスト機能は、特定の翻訳の選択がなぜ行われたのか、ソーステキストのイディオムが何を意味するのか、およびどのような代替翻訳が検討されたかを説明できます。これにより、Translate は単なるルックアップサービスではなく、より効果的な学習ツールになります。

競争上の背景

Google のコンテキスト AI アップデートは、翻訳技術の状況がますます競争力を増しているときに登場します。Google のプロの翻訳よりも顕著に自然な翻訳を見つけるプロフェッショナルの中で実質的なユーザーベースを構築した DeepL も、その製品に大規模言語モデル技術を統合してきました。Microsoft の Azure AI Translator と Amazon の Translate は、どちらもコンテキスト理解を駆動するのと同じ基礎となる Transformer アーキテクチャにアクセスできます。また、Claude、ChatGPT、Gemini などの汎用 AI アシスタントは、翻訳タスクにますます使用されており、短い段落の専用翻訳サービスを上回る出力を生成することもあります。

この競争環境における Google の利点はスケールです。企業は Search、Gmail、およびそれより広いエコシステムからの比類のない多言語テキストのコーパスにアクセスでき、これを使用して文化的に根ざした翻訳モデルをトレーニングできます。この利点が AI 翻訳分野が成熟するにつれて有意義な品質差に変わるかどうかは見われていますが、コンテキスト更新は、歴史的に人間の専門家を必要としていた微妙な高リスク翻訳を処理する Translate の能力における真の進歩を表しています。

この記事は Google AI Blog のレポートに基づいています。元の記事を読む。

Anthropic、AIを戦略インフラとして再定義しつつ拘束力のある監査を求める

AnthropicのDario Amodei CEOは、透明性ルールだけではもはや不十分だとして、最先端AIシステムに対する第三者の義務的監査を求めている。

Read article

Originally published on blog.google

Google Translate が深い AI コンテキスト機能を獲得