五角大楼计划让AI在机密军事数据上进行训练

打开金库

美国国防部正在计划允许人工智能公司在机密军事数据上训练他们的模型，根据MIT Technology Review引述的防务官员所说。该倡议如果实施，将代表美国历史上最重大的AI获取敏感政府信息权限的扩展之一——以及一个刻意的赌注，即获得的能力优势超过向商业AI系统及其开发公司暴露机密数据的风险。

该官员描述了正在开发的一个框架，该框架将允许经过审核的AI公司在安全计算环境中访问机密数据集，使用该数据为特定防务应用训练和微调模型。机密数据将保留在政府控制的基础设施内——AI公司不会将数据带离现场——但他们的人员和模型训练管道将被授予访问通常限于具有适当安全许可的人员的信息。

军事理由很直接：对防务最有价值的AI应用需要访问只有军方拥有的那种数据。训练AI模型以识别卫星图像中的特定军事硬件、分析信号情报、从机密来源合成情报或为机密操作优化后勤，需要反映这些特定领域的训练数据——而该数据根据定义是机密的。

在公开可用数据上训练的商业AI模型对许多防务应用有用，但在分类为最重要的能力差距的领域中根本受到限制。在开源卫星图像上训练的模型永远不会与在机密开顶情报上训练的模型性能相匹配。Pentagon对机密训练数据的兴趣反映了一种认识，即商业AI开发无法在没有只有政府控制的数据的情况下缩小这些差距。

Fast Company描述的一项英国监管裁定将要求Google允许出版商在不牺牲正常搜索可见性的情况下退出AI Overviews，从而在AI内容博弈中形成一个具体的新谈判点。

与这种方法相关的风险是实质性的，跨越几个类别。最明显的是内部威胁和数据泄露：给AI公司人员和系统访问机密数据的权限扩大了潜在泄漏的表面——无论是通过故意盗窃、意外披露还是对AI公司基础设施的对抗性破坏。

第二个风险是模型反演和成员推理攻击——一种攻击者可以通过访问经过训练的模型来提取关于用于训练它的数据的技术。如果机密数据用于训练AI模型，而该模型或其输出随后在对手可以与之交互的背景中部署，则存在从模型的学习表示中恢复敏感信息的潜在途径。

第三，关于AI公司自身的安全态势存在重大问题。即使是最大的AI开发者也经历过安全事件，他们的开发环境没有按照处理机密国家安全信息所需的标准建设。弥合这一差距增加了可能减缓该倡议旨在加速的能力开发的成本和复杂性。

这种推动来自真实紧迫性的背景。China的军事AI计划正在迅速发展，中国国家支持的AI开发可以访问PLA数据，而不受分离商业公司与美国机密系统的法律和制度障碍。Pentagon将商业AI能力与机密数据训练的AI能力之间的差距视为战略脆弱性——更宽松的数据共享框架旨在解决的脆弱性。

该倡议处于开发阶段而非实施阶段，其最终形式将取决于法律审查、分类机构决定和与参与公司的安全协议谈判。但行进的方向是明确的：Pentagon正在朝着使机密军事数据与商业AI开发之间的边界在维持对战略竞争对手的AI优势的服务中变得更具渗透性的模式发展。

本文基于MIT Technology Review的报道。阅读原文。

一架 Helios Horizon 试验机完成了 New Atlas 所称的首个由固态电池驱动的有人固定翼飞行，标志着更高能量密度电动航空的一个可见里程碑。

Originally published on technologyreview.com