最新的人工智能冲突,是在不拿代码的情况下复制

美国与中国之间的技术争端正在进入一个更具体、也更棘手的阶段。所提供的 Ars Technica 来源称,美国官员正准备回应他们所称的针对美国人工智能实验室知识产权的“工业规模”窃取,而蒸馏是这一争论的核心。这一点很重要,因为蒸馏处于正常模型交互与战略性抽取之间的灰色地带。

传统知识产权纠纷通常围绕一些明显的东西展开:源代码、芯片设计、商业机密、泄露文件。蒸馏改变了这种图景。它意味着对手可以通过大规模使用前沿模型的输出,从这些回应中学习,并训练出更便宜的系统,在不直接获得模型权重的情况下攫取原始模型的一部分价值。

为什么华盛顿如此重视此事

根据所提供的来源,美国官员认为主要位于中国的外国实体使用了数以万计的代理账户和越狱技术,来暴露专有信息并从前沿系统中抽取价值。多家人工智能公司也被提及,它们曾就被克隆或被复制的聊天机器人行为提出相关指控。

从华盛顿的角度看,这不只是服务条款问题,而是竞争力问题。如果蒸馏让竞争者能够把多年昂贵的模型开发压缩成一个便宜得多的仿制循环,那么领先实验室就会失去部分原本依靠规模、算力和资本获得的保护。

政策回应可能重新定义模型知识产权

来源指出,国会正被推动把模型抽取视为一种工业间谍活动,并考虑更严厉的处罚。这之所以重要,是因为现行法律并不是针对前沿模型的行为制定的。如果政府决定将大规模蒸馏定性为更接近间谍活动而非滥用,那么人工智能系统周围的法律边界就会被重新划定。

这条边界并不简单。人工智能模型本来就是用来回答问题的。模型越强大,就越难区分合法使用、竞争性基准测试、红队测试,以及有意的抽取。如今,政策制定者被要求明确这条线究竟画在哪里。