Apple因训练数据AI著作权诉讼被点名

在争议之地的诉讼

Apple正面临由Chicken Soup for the Soul提起的新AI著作权诉讼，这家出版商以其长期运营的文集系列而闻名。据路透社首次报道，该诉讼声称Apple未经授权使用了该出版商的内容来训练AI系统——但Apple已经开始与该诉讼中心的数据集保持距离。

根据Apple的说法，诉讼中提及的数据收集不会驱动Apple Intelligence，即跨iPhone、iPad和Mac推出的设备上和基于云的AI功能套件。这个区别很重要：如果争议的数据集从未被用来训练实际在Apple产品中运行的模型，那么诉讼的基础就会大大削弱。

该诉讼紧随出版商、作者和媒体公司在过去两年内对AI开发商提起的类似著作权诉讼浪潮。原告辩称，AI公司未经同意、许可或补偿就抓取并摄入了他们的内容，以训练大型语言模型——这构成了大规模的著作权侵权。

Chicken Soup for the Soul是众多在这一领域采取法律行动的出版商之一，与New York Times等组织并列，后者对OpenAI和Microsoft提起了高调诉讼。目标各不相同，但伤害理论基本相似：受著作权保护的文本在未经许可的情况下被使用并进行商业应用。

这起诉讼的独特之处在于Apple的先发制人的否认。该公司在声称诉讼中引用的数据集——据信是一个公开可得的网络爬虫——不是Apple Intelligence训练管道的一部分时表现得异常直接。如果得到证实，这一主张可能会大大削弱原告的案件。

Trump Media表示，将于8月1日推出付费Truth Social API，为客户提供顶级账号帖文的毫秒级送达以及可追溯至2022年的存档访问。

关于其AI模型的具体训练方式，Apple一直保持沉默，正如大多数主要的AI开发商一样。该公司在iOS 18中推出了Apple Intelligence，并随着每个软件更新继续扩展该系统。功能包括写作工具、图像生成、照片清理和与ChatGPT的集成以处理更复杂的请求。

Apple表示，其设备上的模型使用许可数据和由Apple自身生成的合成数据的组合进行训练——这种方法旨在限制法律风险并改进隐私保护。该公司尚未披露全面的数据来源列表，这在整个行业都是标准做法。

Chicken Soup for the Soul诉讼中提及的数据集似乎是一个在AI研究中广泛流传的独立公开网络语料库。Apple的立场是，即使来自该语料库的数据存在于其研究基础设施中的某个地方，它也没有流入构成Apple Intelligence作为产品的模型。

AI著作权诉讼浪潮没有显示出放缓的迹象。法院仍在处理基础问题——包括用受著作权保护的文本训练AI是否构成合理使用、大规模损害赔偿可能是什么样的，以及AI模型的输出是否构成衍生作品。

对OpenAI和其他公司的里程碑案件的结果受到整个行业的密切关注。认定AI训练在绝对意义上侵权的判决将产生深远的后果。相反，维持广泛合理使用辩护的判决将在未来几年内为AI开发商确定法律环境。

对于Apple来说，风险超越了这一起诉讼。该公司将隐私和负责任的AI开发定位为核心品牌价值。与大规模未经授权的数据使用相关联——即使指控最终被驳回——也违背了这一叙述。

一项拟议中的联邦资助规则引发了异常大量的公众回应，并遭到太空政策倡导者警告，他们认为这可能重塑美国科学的资助与共享方式。

该案例处于早期阶段，尚未确定开庭日期。Apple预计将以引用的特定数据集未在其AI产品中使用为由对诉讼提出异议，并可能寻求早期驳回。

法律分析人士指出，Apple的主动披露——在诉讼获得动力之前公开声明数据集不会驱动Apple Intelligence——是早期澄清记录的战略举动。它也表明Apple已经预料到这种法律攻击，并提前准备了应对措施。

这一辩护是否成立取决于发现揭示Apple实际训练管道的内容。如果Apple的内部数据采购记录支持其公开声称，出版商获得赔偿的途径就会狭隘。如果不支持，该公司面临与困扰其他AI开发商相同的法律责任。

该诉讼突显了科技行业中日益增长的紧张局势：AI系统需要大量文本来达到商业可行性，而负责任地获取该文本的法律框架仍在实时编写中。

本文基于9to5Mac的报道。阅读原文。

Originally published on 9to5mac.com