異議を唱えられた法的根拠

Appleは長年のアンソロジー書籍シリーズで知られるChicken Soup for the Soulの出版社による新たなAI著作権訴訟に直面している。Reutersが最初に報道したこの訴訟では、Appleが未承認でパブリッシャーのコンテンツを使用してAIシステムをトレーニングしたと主張している。ただし、Appleはすでに訴訟の中心にあるデータセットから距離を置こうとしている。

Appleによれば、訴訟で指摘されたデータ集は、iPhone、iPad、Macで展開されたAppleのオンデバイスおよびクラウドベースのAI機能スイートであるApple Intelligenceを動作させていない。この区別は重要である。もし異議を唱えられたデータセットが実際にApple製品で実行されるモデルをトレーニングするために使用されなかったとすれば、訴訟の根拠は著しく弱くなる。

訴訟の主張

この訴訟は、過去2年間にAI開発企業に対してパブリッシャー、著者、メディア企業が起こした同様の著作権訴訟の波に続くものである。原告らは、AI企業が同意、ライセンス、または補償なく彼らのコンテンツをスクレイプして取り込み、大規模言語モデルをトレーニングしたと主張しており、それは大規模な著作権侵害を構成していると述べている。

Chicken Soup for the Soulはこの分野で法的措置を講じた多くのパブリッシャーの1つであり、New York Timesなどの組織と同じ立場にある。New York TimesはOpenAIとMicrosoftに対して注目を集めた訴訟を提起した。対象は異なるが、害の理論は大体同じである。著作権で保護されたテキストが許可なく取得され、商業的に使用された。

この特定の訴訟を区別しているのは、Appleの先制的な否定である。同社は、引用されたデータセット(公開されているウェブクローラーと考えられている)がApple Intelligenceのトレーニングパイプラインの一部ではないと述べており、異常なほど直接的である。その主張が実証されれば、原告の事件をかなり複雑にする可能性がある。

Apple IntelligenceとそのトレーニングデータのAI

Appleはそのモデルのトレーニング方法の詳細については沈黙を守っており、ほとんどの主要なAI開発企業と同様である。同社はiOS 18でApple Intelligenceを立ち上げ、各ソフトウェアアップデートでシステムを拡張し続けている。機能には、作成ツール、画像生成、写真クリーンアップ、より複雑な要求に対するChatGPTの統合が含まれる。

Appleは、そのオンデバイスモデルがライセンス取得データと自社が生成した合成データの組み合わせを使用してトレーニングされていると述べており、このアプローチは法的暴露を制限し、プライバシーを改善するために設計されている。同社は、データソースの包括的なリストを開示していない。これは業界全体で標準である。

Chicken Soup for the Soul訴訟で参照されているデータセットは、AI研究で広く流通している個別のオープンウェブコーパスであるようである。Appleの立場は、そのコーパスからのデータがAppleの研究インフラストラクチャのどこかに存在したとしても、Apple Intelligenceを構成するモデルには流入しなかったというものである。