在争议之地的诉讼

Apple正面临由Chicken Soup for the Soul提起的新AI著作权诉讼,这家出版商以其长期运营的文集系列而闻名。据路透社首次报道,该诉讼声称Apple未经授权使用了该出版商的内容来训练AI系统——但Apple已经开始与该诉讼中心的数据集保持距离。

根据Apple的说法,诉讼中提及的数据收集不会驱动Apple Intelligence,即跨iPhone、iPad和Mac推出的设备上和基于云的AI功能套件。这个区别很重要:如果争议的数据集从未被用来训练实际在Apple产品中运行的模型,那么诉讼的基础就会大大削弱。

诉讼的声称

该诉讼紧随出版商、作者和媒体公司在过去两年内对AI开发商提起的类似著作权诉讼浪潮。原告辩称,AI公司未经同意、许可或补偿就抓取并摄入了他们的内容,以训练大型语言模型——这构成了大规模的著作权侵权。

Chicken Soup for the Soul是众多在这一领域采取法律行动的出版商之一,与New York Times等组织并列,后者对OpenAI和Microsoft提起了高调诉讼。目标各不相同,但伤害理论基本相似:受著作权保护的文本在未经许可的情况下被使用并进行商业应用。

这起诉讼的独特之处在于Apple的先发制人的否认。该公司在声称诉讼中引用的数据集——据信是一个公开可得的网络爬虫——不是Apple Intelligence训练管道的一部分时表现得异常直接。如果得到证实,这一主张可能会大大削弱原告的案件。

Apple Intelligence和其训练数据

关于其AI模型的具体训练方式,Apple一直保持沉默,正如大多数主要的AI开发商一样。该公司在iOS 18中推出了Apple Intelligence,并随着每个软件更新继续扩展该系统。功能包括写作工具、图像生成、照片清理和与ChatGPT的集成以处理更复杂的请求。

Apple表示,其设备上的模型使用许可数据和由Apple自身生成的合成数据的组合进行训练——这种方法旨在限制法律风险并改进隐私保护。该公司尚未披露全面的数据来源列表,这在整个行业都是标准做法。

Chicken Soup for the Soul诉讼中提及的数据集似乎是一个在AI研究中广泛流传的独立公开网络语料库。Apple的立场是,即使来自该语料库的数据存在于其研究基础设施中的某个地方,它也没有流入构成Apple Intelligence作为产品的模型。