伊朗学校遭袭暴露五角大楼AI目标识别风险

一场改变争论的打击

2026年2月28日，也就是美国对伊朗开展军事行动的第一天，一枚战斧巡航导弹摧毁了伊朗南部霍尔木兹甘省米纳布的Shajareh Tayyebeh小学。此次打击造成168人死亡，其中100多人是12岁以下儿童。学校距离伊朗伊斯兰革命卫队的一处海军设施不到100码，两者之间隔着一堵墙，而这堵墙的建造已在2013年至2016年的卫星图像中得到记录。那堵墙，以及被其围起的学校，并未在生成目标的情报数据库中更新。

该目标由Maven Smart System生成，这是Palantir Technologies打造、在一份价值13亿美元的五角大楼合同下运行的平台。Maven整合卫星图像、无人机画面、雷达回波和信号情报，然后借助一层AI - 基于Anthropic的Claude模型构建 - 对目标进行排序并提出建议。在行动最初24小时内，该系统生成了数百个坐标，并支持了1,000多次打击。这是美国军事史上规模最大的AI辅助目标识别实战测试。而它导致了对米纳布的打击。

出了什么问题

上周向国会监督委员会简报的官方调查将这次失败归因于过时情报，而非Maven的AI算法存在缺陷。国防情报局的目标数据库并未更新，以反映学校的建成情况。当Maven查询该数据库时，它返回了相邻IRGC设施的坐标，却没有任何提示表明在这十年间出现了新建筑。导弹随后沿着这些坐标飞行。

审阅调查结果的前目标识别官员表示，"人类 - 不是AI - 才是责任所在"这一结论在技术上是正确的，但忽略了实战现实。在Maven出现之前，这种敏感程度的打击目标识别流程通常会包含多层人工审查、附带损害评估，以及与更新图像的交叉核对。Maven的架构为了满足首日作战所需的数量和速度，把这一流程压缩了。按照旧系统，本应接受数小时人工审视的目标，在Maven下只得到了几分钟。

Navy, Army risk wasting money, time without unified hypersonic missile strategy: GAO - Breaking Defense

GAO警告称，五角大楼分散的高超音速计划正在推高成本和进度风险

美国政府问责局的一份新报告称，陆军和海军对一个共享的高超音速导弹项目管理过于分散，这给五角大楼最昂贵的项目之一增加了延误、生产压力和成本风险，

Read article

Maven的准确率记录

米纳布打击迫使外界公开审视五角大楼通常不会写入公开文件的绩效数据。Maven在伊朗行动中的整体目标识别准确率估计约为60%，这意味着系统生成的目标中，大约五分之二存在足以影响打击结果的错误，其中包括将民用建筑误判为军事目标。相比之下，在相似时间限制下处理同样目标集的资深人工分析员，准确率约为84%。

在不利条件下 - 光线差、云层厚、存在主动反制措施 - Maven的准确率会降至30%以下。显示在目标终端上的信心分数并不会相应调整。空军在2021年对早期目标识别AI进行的一项研究发现，该系统在输出中显示90%的信心评级，但在实地评估中真实准确率只有25%。Maven的操作员也报告了显示信心与实际可靠性之间的类似不匹配。

原本不存在的制度支撑

这次打击还暴露出，在行动开始前，用于捕捉AI错误的人类监督机制在多大程度上已被掏空。五角大楼的Civilian Protection Center of Excellence负责制定教义并审查在AI辅助行动中尽量减少平民伤亡的程序，在伊朗行动前18个月里，其预算和人员大约被削减了90%。CENTCOM专门的平民伤亡评估团队 - 负责审查打击结果并标记需要调查的模式的单位 - 则从10人缩减到只剩一名军官。

这些削减反映了一种更广泛的制度姿态，即将大规模部署Maven视为一种效率收益，减少了对并行人工审查结构的需求。其假设是，AI会同时让目标识别更快、更准确，从而减少而不是增加负责任运作所需的人力工作量。米纳布的结果表明，这一假设是错误的。

USAF Plans To Buy 28,000 Low-Cost Cruise Missiles In Five Years Advance With New Deals

美国空军推进大规模采购低成本巡航导弹计划

新的五角大楼框架协议支持空军在五年内采购近 2.8 万枚低成本巡航导弹的计划，这是其“可负担大规模导弹家族”项目的一部分。

Read article

强制推广仍在继续

尽管调查得出了上述结论，国防部副部长Steve Feinberg仍在推动将Maven正式化为官方项目，并要求到2026年9月在所有军种中全面采用。知情官员称，理由是伊朗行动的整体目标识别表现 - 包括米纳布打击 - 仍然比没有该系统时所能做到的更好。Maven在行动最初几小时内实现目标识别的速度，被视为在当前威胁环境下的战略必要性。

五角大楼内外的批评者认为，9月的强制要求会在米纳布调查中发现的监督和数据库时效问题尚未修复前，就形成部署压力。一名乌克兰无人机开发者曾在战斗条件下与半自主系统合作，他在袭击后的公开声明中表示，米纳布"暴露了半自主战争中一个熟悉的危险：系统按规格运行，而规格是错的，孩子们却已经死了。"

改革会是什么样子

在五角大楼内部以及防务政策研究者之间流传的提案包括：对用于AI生成目标识别的情报数据库条目设置强制时效要求 - 任何超过30天的条目都不能在未经人工审查的情况下用于自主推荐。另一些提案则建议，用反映恶劣条件下已知性能下降的准确率范围估计值，取代Maven当前的信心显示，以便让操作员对可靠性有更诚实的判断。普遍认为，恢复在行动前被削减的平民保护和伤亡评估基础设施，是系统继续负责任运行的前提。

据官员称，改革议程上没有的是在全面审查完成前暂停Maven。该系统如今已嵌入多个战区的作战规划，支持AI辅助目标识别的制度动力也相当强劲。争论的焦点已不再是AI是否会参与目标决策，而是在允许这类系统的速度优势压倒人工审查所提供的审慎之前，必须具备哪些保障措施。

本文基于Defense News的报道。阅读原文。

UK Unveils Storm Fighter Loyal Wingman Program

英国推出 Storm Fighter 忠诚僚机计划

英国公布了 Storm Fighter，这是一项新的协同作战飞机计划，旨在让自主无人机与 Typhoon、F-35 以及未来的 Tempest 协同作战。

Read article

Originally published on defensenews.com

伊朗学校遭袭暴露五角大楼推进AI目标识别的裂痕

一场改变争论的打击

出了什么问题

GAO警告称，五角大楼分散的高超音速计划正在推高成本和进度风险

Maven的准确率记录

原本不存在的制度支撑

美国空军推进大规模采购低成本巡航导弹计划

强制推广仍在继续

改革会是什么样子

英国推出 Storm Fighter 忠诚僚机计划

Comments (0)

Related Articles

RIMPAC测试无人机和3D打印以维持太平洋地区部队

海军 MUSV 争议在两家公司被淘汰后诉诸法庭

Keep Reading