最新的人工智能冲突,是在不拿代码的情况下复制
美国与中国之间的技术争端正在进入一个更具体、也更棘手的阶段。所提供的 Ars Technica 来源称,美国官员正准备回应他们所称的针对美国人工智能实验室知识产权的“工业规模”窃取,而蒸馏是这一争论的核心。这一点很重要,因为蒸馏处于正常模型交互与战略性抽取之间的灰色地带。
传统知识产权纠纷通常围绕一些明显的东西展开:源代码、芯片设计、商业机密、泄露文件。蒸馏改变了这种图景。它意味着对手可以通过大规模使用前沿模型的输出,从这些回应中学习,并训练出更便宜的系统,在不直接获得模型权重的情况下攫取原始模型的一部分价值。
为什么华盛顿如此重视此事
根据所提供的来源,美国官员认为主要位于中国的外国实体使用了数以万计的代理账户和越狱技术,来暴露专有信息并从前沿系统中抽取价值。多家人工智能公司也被提及,它们曾就被克隆或被复制的聊天机器人行为提出相关指控。
从华盛顿的角度看,这不只是服务条款问题,而是竞争力问题。如果蒸馏让竞争者能够把多年昂贵的模型开发压缩成一个便宜得多的仿制循环,那么领先实验室就会失去部分原本依靠规模、算力和资本获得的保护。
政策回应可能重新定义模型知识产权
来源指出,国会正被推动把模型抽取视为一种工业间谍活动,并考虑更严厉的处罚。这之所以重要,是因为现行法律并不是针对前沿模型的行为制定的。如果政府决定将大规模蒸馏定性为更接近间谍活动而非滥用,那么人工智能系统周围的法律边界就会被重新划定。
这条边界并不简单。人工智能模型本来就是用来回答问题的。模型越强大,就越难区分合法使用、竞争性基准测试、红队测试,以及有意的抽取。如今,政策制定者被要求明确这条线究竟画在哪里。
更广泛的地缘政治信息
这场争端也表明,人工智能竞争正在走向成熟。第一阶段围绕芯片、人才和模型发布展开。下一阶段则围绕输出控制、防止模仿的防御,以及模型型知识产权的可执行性展开。换句话说,这场战略竞争正在向上层堆栈移动。
这产生的影响可能不止于美中关系。如果各国政府开始把模型抽取视为国家安全问题,人工智能公司或许会获得更多官方威胁情报,建立更严格的账户控制,并游说制定新的法律来刑事化新形式的抓取和模仿。结果将是一个更紧密、也更强调安全的人工智能产业。
一个代价真实存在的难题
挑战在于,争议中的核心技术在概念上与从观察中学习非常接近,而这种学习一直是竞争的一部分。美国官员认为,差别在于规模、自动化、欺骗和意图。当抽取是通过庞大的代理网络和系统性规避来实施时,他们是在表明这种行为不再像正常市场竞争,而更像有组织的攫取。
这种表述很快可能推动制裁、新立法或更严厉的执法。无论这些措施是否迅速到来,源材料已经清楚表明一点:人工智能竞赛不再只是争先构建最好的系统,也是在防止别人足够快地复制其价值,从而抹平领先优势。
本文基于 Ars Technica 的报道。阅读原文。
Originally published on arstechnica.com







