Une frappe qui a changé le débat
Le 28 février 2026, premier jour des opérations militaires américaines contre l'Iran, un missile de croisière Tomahawk a détruit l'école primaire Shajareh Tayyebeh à Minab, dans la province d'Hormozgan, au sud de l'Iran. La frappe a tué 168 personnes, dont plus de 100 enfants de moins de 12 ans. L'école se trouvait à moins de 100 yards d'une installation navale du Corps des gardiens de la révolution islamique, séparée d'elle par un mur dont la construction était documentée dans des images satellites datant de 2013 à 2016. Ce mur, et l'école qu'il entourait, n'avaient pas été mis à jour dans la base de données de renseignement qui a généré la cible.
La cible a été générée par Maven Smart System, une plateforme conçue par Palantir Technologies et exploitée dans le cadre d'un contrat du Pentagone de 1,3 milliard de dollars. Maven fusionne des images satellites, des flux de drones, des retours radar et du renseignement d'origine électromagnétique, puis utilise une couche d'IA - construite sur le modèle Claude d'Anthropic - pour classer et recommander des cibles. Au cours des 24 premières heures d'opérations, le système a généré des centaines de coordonnées et appuyé plus de 1 000 frappes. Il s'agissait du plus grand test opérationnel de ciblage assisté par IA dans l'histoire militaire américaine. Et il a produit la frappe sur Minab.
Ce qui n'a pas fonctionné
L'enquête officielle, présentée la semaine dernière aux commissions de contrôle du Congrès, a attribué l'échec à des renseignements obsolètes plutôt qu'à une défaillance des algorithmes d'IA de Maven. La base de données de ciblage de la Defense Intelligence Agency n'avait pas été mise à jour pour tenir compte de la construction de l'école. Lorsque Maven a interrogé cette base, elle a renvoyé les coordonnées de l'installation adjacente du CGRI sans signaler qu'une nouvelle structure était apparue au cours de la décennie écoulée. Le missile a suivi ces coordonnées.
D'anciens officiers de ciblage ayant examiné les conclusions estiment que la conclusion selon laquelle "les humains - pas l'IA - sont responsables" est techniquement exacte, mais qu'elle passe à côté de la réalité opérationnelle. Avant Maven, le processus de ciblage d'une frappe de cette sensibilité aurait comporté plusieurs niveaux de revue humaine, d'estimation des dommages collatéraux et de recoupement avec des images actualisées. L'architecture de Maven a comprimé ce processus pour répondre aux exigences de volume et de vitesse du premier jour opérationnel. Une cible qui aurait reçu des heures d'examen humain sous l'ancien système n'a reçu que quelques minutes sous Maven.
Le bilan de précision de Maven
La frappe de Minab a forcé un examen public des données de performance que le Pentagone a généralement tenu à l'écart des documents publics. La précision globale de ciblage de Maven dans la campagne iranienne a été estimée à environ 60 % - ce qui signifie qu'environ deux cibles sur cinq générées par le système contiennent des erreurs suffisamment importantes pour affecter l'issue de la frappe, y compris des erreurs d'identification de structures civiles. À titre de comparaison, des analystes humains expérimentés travaillant sur les mêmes ensembles de cibles atteignent environ 84 % de précision dans des contraintes de temps similaires.
Dans des conditions défavorables - faible luminosité, forte couverture nuageuse, contre-mesures actives - la précision de Maven tombe en dessous de 30 %. Les scores de confiance affichés aux opérateurs sur les terminaux de ciblage ne s'ajustent pas en conséquence. Une étude de l'Armée de l'air de 2021 sur une précédente IA de ciblage a montré que le système affichait des niveaux de confiance de 90 % dans ses sorties tout en n'atteignant que 25 % de précision réelle lors de l'évaluation sur le terrain. Les opérateurs de Maven ont signalé des écarts similaires entre la confiance affichée et la fiabilité réelle.
L'infrastructure institutionnelle qui n'était pas là
La frappe a également révélé à quel point les structures de supervision humaine destinées à détecter les erreurs de l'IA avaient été vidées de leur substance avant le début des opérations. Le Civilian Protection Center of Excellence du Pentagone, chargé d'élaborer la doctrine et d'examiner les procédures visant à réduire les pertes civiles dans les opérations assistées par IA, a vu son budget et ses effectifs réduits d'environ 90 % au cours des 18 mois précédant la campagne iranienne. L'équipe dédiée de CENTCOM chargée de l'évaluation des pertes civiles - l'unité responsable de l'examen des résultats des frappes et du repérage des tendances nécessitant une enquête - était passée de 10 personnes à un seul officier.
Ces réductions reflétaient une posture institutionnelle plus large selon laquelle le déploiement de Maven à grande échelle était considéré comme un gain d'efficacité réduisant le besoin de structures parallèles de revue humaine. L'hypothèse était que l'IA rendrait le processus de ciblage à la fois plus rapide et plus précis, réduisant ainsi plutôt qu'augmentant la charge de travail humaine nécessaire à un usage responsable. Le résultat à Minab suggère que cette hypothèse était erronée.
Le déploiement obligatoire se poursuit
Malgré les conclusions de l'enquête, le vice-secrétaire à la Défense Steve Feinberg a poursuivi la formalisation de Maven comme programme officiel, avec un mandat exigeant son adoption dans toutes les branches des forces armées d'ici septembre 2026. Selon des responsables informés de la décision, la justification est que la performance globale de ciblage de la campagne iranienne - y compris la frappe sur Minab - représente encore une amélioration par rapport à ce qui aurait été possible sans le système. La rapidité avec laquelle Maven a permis le ciblage lors des premières heures de l'opération est considérée comme une nécessité stratégique compte tenu de l'environnement de menace.
Des critiques, à l'intérieur comme à l'extérieur du Pentagone, estiment que l'échéance de septembre crée une pression pour déployer avant que les problèmes de supervision et d'actualité des bases de données identifiés dans l'enquête Minab n'aient été corrigés. Un développeur ukrainien de drones ayant travaillé avec des systèmes semi-autonomes en conditions de combat a déclaré dans une prise de position publique après la frappe que Minab avait "révélé un danger familier de la guerre semi-autonome : le système fonctionne selon les spécifications, les spécifications étaient erronées, et des enfants sont morts."
À quoi ressemble une réforme
Les propositions qui circulent au Pentagone et parmi les chercheurs en politique de défense incluent des exigences obligatoires de fraîcheur pour les entrées de bases de données de renseignement utilisées dans le ciblage généré par IA - aucune entrée de plus de 30 jours ne serait éligible à une recommandation autonome sans examen humain. D'autres proposent de remplacer l'affichage de confiance de Maven par des estimations de plage de précision reflétant la dégradation connue des performances dans des conditions défavorables, afin que les opérateurs aient une image plus honnête de la fiabilité. Le rétablissement de l'infrastructure de protection des civils et d'évaluation des victimes, réduite avant la campagne, est largement cité comme un préalable à la poursuite responsable du fonctionnement du système.
Ce qui ne figure pas à l'agenda des réformes, selon des responsables, est la suspension de Maven en attendant un examen complet. Le système est désormais intégré à la planification opérationnelle sur plusieurs théâtres, et l'élan institutionnel en faveur du ciblage assisté par IA est considérable. Le débat ne porte plus sur la question de savoir si l'IA aidera aux décisions de ciblage, mais sur les garde-fous qui doivent exister avant que les avantages de vitesse de tels systèmes soient autorisés à l'emporter sur la délibération qu'apporte l'examen humain.
Cet article est fondé sur le reportage de Defense News. Lire l'article original.
Originally published on defensenews.com



