军事AI对齐问题
自2018年美国国防部成立联合人工智能中心以来,以及其继任机构首席数字和人工智能办公室在2022年的成立,美国国防部一直在积极采用AI。但随着五角大楼与越来越多的AI公司签署合同——从老牌国防承包商到硅谷初创公司再到前沿模型实验室——一个新的挑战出现了:不兼容的AI工具的增加、不同的模型版本以及军事各个指挥部和分支之间能力水平的不一致。
五角大楼的应对措施是标准化其AI供应商,让所有这些供应商都在官员们所称的同一基线上运作——共享的模型版本、API、安全政策和性能基准集合,这将允许不同的军事系统相互协作,也让监督官员对部署在哪里的AI能力有一个完整的了解。
Claude在军事背景下的应用
在五角大楼正在努力标准化访问权限的AI系统中,包括Anthropic的Claude——一个前沿大语言模型,已被各种国防相关承包商和DoD组织直接使用,用于文档分析、情报处理和决策支持等任务。Claude与来自OpenAI、Google和Microsoft的系统一起被纳入,反映了五角大楼希望在多个前沿AI供应商之间保持选择权,而不是依赖于任何单一供应商的愿望。
与某些竞争对手相比,Anthropic与军事承包商的关系更加复杂。该公司的可接受使用政策禁止使用Claude进行武器开发、攻击关键基础设施和其他几类有害应用。但在军事背景下,禁止和允许的使用情况之间的界线并不总是清晰的——文档分析、后勤优化和决策支持是表面上中立的应用,但在实践中可能会对包括致命行动在内的军事行动作出贡献。
OpenAI机器人主管Caitlin Kalinowski因该公司与五角大楼的交易而辞职,理由是对致命自主性和反思不足的担忧,这突显了前沿AI公司在与军事客户接触时面临的伦理紧张局势。Anthropic尚未公开披露Claude对DoD客户的可用条件或哪些监督机制管理其军事使用。
用于军事目标定位的AI:核心问题
AI在军事背景下最敏感的应用是目标定位——使用自动化系统来识别、优先级排序,在某些情况下帮助接触敌方目标。美国军事教义要求人类授权致命武力决定,但AI在处理传感器数据、识别潜在目标和向人类决策者提交建议方面的作用在近年来急剧扩大。
Project Maven是五角大楼基于AI的图像分析程序,处理无人机监视视频以识别需要人类审查的感兴趣的目标。AI不会做出最终的致命决定——人类会做出——但它塑造了什么信息到达人类以及如何呈现,这引发了关于教义名义上要求的人类监督的有意义质量的问题。
标准化工作在一定程度上是对监督关切的回应:如果不同的AI系统对相同的输入给出不同的输出,或者如果没有人完全清楚哪些AI系统对哪些决定作出了贡献,那么对AI辅助的目标定位进行有意义的人类监督就变得极其困难。标准化创造了可审计性——能够知道哪个模型、在哪个版本、在哪些安全设置下参与了任何给定的决策链。
伦理架构问题
AI伦理社区的批评者辩称,标准化解决了治理问题,但没有解决更根本的伦理问题:AI是否应该用于目标定位决定,如果是的话,在什么约束下。让所有军事AI供应商都在同一基线上运作意味着定义该基线是什么——什么价值观、什么安全政策、什么禁止使用被纳入标准。这个定义过程在很大程度上是在公众视线之外进行的。
把事情做对的风险很高。引入偏见到目标定位决定中的AI系统、产生幻觉的威胁评估或被对抗性输入操纵的系统可能会导致战斗情况下的灾难性错误。五角大楼的标准化推动是对这一风险的承认——但应对措施的充分性最终将由系统在无法完全预见的操作条件下的表现来判断。
本文基于MIT Technology Review的报道。阅读原文。
Originally published on technologyreview.com


