一场改变争论的打击

2026年2月28日,也就是美国对伊朗开展军事行动的第一天,一枚战斧巡航导弹摧毁了伊朗南部霍尔木兹甘省米纳布的Shajareh Tayyebeh小学。此次打击造成168人死亡,其中100多人是12岁以下儿童。学校距离伊朗伊斯兰革命卫队的一处海军设施不到100码,两者之间隔着一堵墙,而这堵墙的建造已在2013年至2016年的卫星图像中得到记录。那堵墙,以及被其围起的学校,并未在生成目标的情报数据库中更新。

该目标由Maven Smart System生成,这是Palantir Technologies打造、在一份价值13亿美元的五角大楼合同下运行的平台。Maven整合卫星图像、无人机画面、雷达回波和信号情报,然后借助一层AI - 基于Anthropic的Claude模型构建 - 对目标进行排序并提出建议。在行动最初24小时内,该系统生成了数百个坐标,并支持了1,000多次打击。这是美国军事史上规模最大的AI辅助目标识别实战测试。而它导致了对米纳布的打击。

出了什么问题

上周向国会监督委员会简报的官方调查将这次失败归因于过时情报,而非Maven的AI算法存在缺陷。国防情报局的目标数据库并未更新,以反映学校的建成情况。当Maven查询该数据库时,它返回了相邻IRGC设施的坐标,却没有任何提示表明在这十年间出现了新建筑。导弹随后沿着这些坐标飞行。

审阅调查结果的前目标识别官员表示,"人类 - 不是AI - 才是责任所在"这一结论在技术上是正确的,但忽略了实战现实。在Maven出现之前,这种敏感程度的打击目标识别流程通常会包含多层人工审查、附带损害评估,以及与更新图像的交叉核对。Maven的架构为了满足首日作战所需的数量和速度,把这一流程压缩了。按照旧系统,本应接受数小时人工审视的目标,在Maven下只得到了几分钟。

Maven的准确率记录

米纳布打击迫使外界公开审视五角大楼通常不会写入公开文件的绩效数据。Maven在伊朗行动中的整体目标识别准确率估计约为60%,这意味着系统生成的目标中,大约五分之二存在足以影响打击结果的错误,其中包括将民用建筑误判为军事目标。相比之下,在相似时间限制下处理同样目标集的资深人工分析员,准确率约为84%。

在不利条件下 - 光线差、云层厚、存在主动反制措施 - Maven的准确率会降至30%以下。显示在目标终端上的信心分数并不会相应调整。空军在2021年对早期目标识别AI进行的一项研究发现,该系统在输出中显示90%的信心评级,但在实地评估中真实准确率只有25%。Maven的操作员也报告了显示信心与实际可靠性之间的类似不匹配。