参考機関の反撃
ブリタニカ百科事典とメリアム・ウェブスター辞書は、英語圏で最も尊敬される2つの参考出版社であり、OpenAIを訴えており、同社が著作権で保護されたコンテンツの無許可でそのChatGPTモデルを訓練したと主張しています。その訴訟は、OpenAIが何世代にもわたる編集者、語彙学者、主題専門家の知的業績を商用AIシステムの訓練データに効果的に変えていると主張し、現在はその結果として生じた能力を使用して元の出版社と直接競争しており、彼らの操業を支えるウェブトラフィックと広告収益を争っています。
核心的な主張はAI著作権訴訟の成長する本体から、著作権で保護されたテキストで大規模言語モデルを訓練することは著作権侵害を構成するということが、モデルが特定の段落を記憶するかまたは単にトレーニングコーパスからパターンと知識を組み入れるかどうかに関わらず。この訴訟を区別するのは競争上の害の議論の直接性です—これらは彼らのビジネスモデルがユーザーが彼らのウェブサイトに来て情報を探すことに依存している組織であり、ユーザーが代わりにChatGPTから彼らの質問への回答を得ています。
トラフィック蚕食の問題
原告はChatGPTが彼らのトラフィックを蚕食していると主張しています—多くのセクターで情報経済を再形成している現象への直接的な用語。ユーザーがChatGPTに歴史的事象を説明し、単語を定義し、トピックを要約するよう要求し、流暢で包括的な回答を受け取るとき、そのユーザーがブリタニカまたはメリアム・ウェブスターを訪問する理由はありません。ページビューと広告収益を生成する可能性があった参考資料の検索は、現在ChatGPTインターフェース内で完全に発生しています。
この動力学は、ニュース組織またはクリエイティブコンテンツ作成者にとっては異なる方法で参考出版社にとって存在的です。ブリタニカのビジネスモデル—インターネットの出現後に印刷百科事典販売からデジタルサブスクリプションに転換した—は、ユーザーがブリタニカに来る理由を持つことに依存しています。AIアシスタントが百科事典レベルの質問に確実に答えることができると、ブリタニカサブスクリプションのトラフィック根拠は完全に侵蝕される可能性があります。
メリアム・ウェブスターは同様の問題に直面しています。辞書ルックアップは、インターネットの初期時代からウェブトラフィックの定番であり、広告サポートの辞書サイトを維持しています。単語を定義し、語源を説明し、使用例を提供し、意味のニュアンスを明確にすることができるAIモデル—メリアム・ウェブスター辞書のコンテンツをほぼ確実に含むトレーニングデータから引き出される—は、メリアム・ウェブスターが販売する製品の直接的な代替品です。
法的理論とその先例
AI訓練ケースにおける著作権侵害の理論は、ニューヨーク・タイムズが2023年後半にOpenAIとマイクロソフトに対して歴史的な訴訟を提起して以来、複数の戦線で争われています。OpenAIの主な防御—公開利用可能なコンテンツでの訓練は適切な使用を構成する—はまだ完全に判断されていないため、裁判所は議論の強度に関して混合シグナルを発します。
適切な使用分析には4つの要素が含まれます:使用の目的と性質、著作権で保護された作品の性質、使用された量、および元の作品の市場への影響。特に参考出版社の場合、4番目の要素—市場への影響—は彼らのケースの最も説得力のある要素である可能性があります。彼らがOpenAIの彼らのコンテンツへの訓練に因果的に関連されたトラフィックと収益の測定可能な減少を実証することができれば、彼らは仮説的な損害についての推測を超える証拠を持っています。
同時に、OpenAIの適切な使用議論は事実参考コンテンツの方がクリエイティブ作品よりも強いです。著作権は事実ではなく表現を保護します—百科事典は歴史的出来事や科学的発見自体ではなく、それらを説明するために使用された特定の言語の著作権を主張することはできません。これは、ブリタニカとメリアム・ウェブスターが彼らの侵害主張が成功した場合でも最終的に得られる救済の範囲を制限する可能性があります。
出版社抵抗のより広いパターン
この訴訟はAI著作権訴訟の大量の本に参加しています。作家ギルド、様々なニュース組織、レコードレーベル、ビジュアルアーティスト、およびコードプラットフォームはすべて訴訟を提起または脅迫しています。OpenAIは一部の出版社と和解しており、特に協会プレス、およびNews CorpとThe Atlanticを含む他の出版社からコンテンツをライセンスしています。
このパターンは、OpenAIが継続的な協力が戦略的価値を持つコンテンツクリエイターと選別的に和解していることを示唆しており、その継続的な協力が戦略的価値を持つニュース組織であり、モデルを現在の状態に保つことができるコンテンツ、訓練データが継続的ではなく歴史的であった当事者からの請求に異議を唱えています。ブリタニカとメリアム・ウェブスターが和解が訴訟よりも価値のあるカテゴリーに該当するかどうかは、交渉レバレッジ、訴訟費用、およびOpenAIがケースが彼らのより広い適切な使用議論に対する法的リスクの評価に依存します。
この記事はGizmodoのレポートに基づいています。元の記事を読む。

