Ein Schlag, der die Debatte veränderte

Am 28. Februar 2026, dem ersten Tag der US-Militäroperationen gegen Iran, zerstörte eine Tomahawk-Marschflugrakete die Grundschule Shajareh Tayyebeh in Minab in der südiranischen Provinz Hormozgan. Bei dem Angriff wurden 168 Menschen getötet, mehr als 100 davon Kinder unter 12 Jahren. Die Schule lag weniger als 100 Yards von einer Marineanlage des Korps der Islamischen Revolutionsgarden entfernt - getrennt durch eine Mauer, deren Bau in Satellitenbildern aus den Jahren 2013 bis 2016 dokumentiert war. Diese Mauer und die darin eingeschlossene Schule waren in der Aufklärungsdatenbank, die das Ziel erzeugte, nicht aktualisiert worden.

Das Ziel wurde vom Maven Smart System generiert, einer von Palantir Technologies entwickelten Plattform, die im Rahmen eines 1,3-Milliarden-Dollar-Vertrags mit dem Pentagon betrieben wird. Maven bündelt Satellitenbilder, Drohnen-Feeds, Radardaten und Signalaufklärung und nutzt dann eine KI-Ebene - auf Basis von Anthropics Claude-Modell - um Ziele zu bewerten und zu empfehlen. In den ersten 24 Stunden der Operation erzeugte das System Hunderte von Koordinaten und unterstützte mehr als 1.000 Angriffe. Es war der größte operative Test KI-gestützter Zielerfassung in der Geschichte des US-Militärs. Und es führte zu dem Angriff auf Minab.

Was schiefgelaufen ist

Die offizielle Untersuchung, die vergangene Woche den parlamentarischen Aufsichtsausschüssen vorgelegt wurde, führte das Versagen auf veraltete Aufklärung zurück, nicht auf einen Fehler in Mavens KI-Algorithmen. Die Zielerfassungsdatenbank der Defense Intelligence Agency war nicht aktualisiert worden, um den Bau der Schule abzubilden. Als Maven diese Datenbank abfragte, lieferte sie die Koordinaten der benachbarten IRGC-Anlage, ohne einen Hinweis darauf, dass im vergangenen Jahrzehnt eine neue Struktur hinzugekommen war. Die Rakete folgte diesen Koordinaten.

Ehemalige Zielerfassungsbeamte, die die Ergebnisse geprüft haben, sagen, die Schlussfolgerung, dass "Menschen - nicht KI - verantwortlich sind", sei technisch korrekt, verfehle aber die operative Realität. Vor Maven hätte der Zielerfassungsprozess für einen derart sensiblen Schlag mehrere Ebenen menschlicher Prüfung, Schätzungen von Kollateralschäden und den Abgleich mit aktualisierten Bildern umfasst. Mavens Architektur verkürzte diesen Prozess, um die Volumen- und Geschwindigkeitsanforderungen des ersten Einsatztages zu erfüllen. Ein Ziel, das nach dem vorherigen System Stunden menschlicher Prüfung erhalten hätte, bekam unter Maven nur Minuten.

Mavens Genauigkeitsbilanz

Der Angriff auf Minab hat eine öffentliche Auseinandersetzung mit Leistungsdaten erzwungen, die das Pentagon im Allgemeinen aus öffentlichen Dokumenten heraushält. Mavens Gesamtgenauigkeit bei der Zielerfassung im Iran-Feldzug wurde auf etwa 60 Prozent geschätzt - das bedeutet, dass ungefähr zwei von fünf vom System erzeugten Zielen Fehler enthalten, die das Angriffsergebnis beeinflussen, einschließlich der Fehlidentifikation ziviler Strukturen. Zum Vergleich: Erfahrene menschliche Analysten, die mit denselben Zielmengen arbeiten, erreichen unter ähnlichem Zeitdruck etwa 84 Prozent Genauigkeit.

Unter ungünstigen Bedingungen - schlechte Beleuchtung, dichte Wolkendecke, aktive Gegenmaßnahmen - fällt Mavens Genauigkeit unter 30 Prozent. Die vom System an Zielstationen angezeigten Vertrauenswertungen passen sich daran nicht an. Eine Studie der Air Force aus dem Jahr 2021 zu einer früheren Zielerfassungs-KI stellte fest, dass das System bei seinen Ausgaben 90-Prozent-Vertrauenswerte anzeigte, während es bei der Feldbewertung nur 25 Prozent reale Genauigkeit erreichte. Mavens Betreiber haben ähnliche Abweichungen zwischen angezeigtem Vertrauen und tatsächlicher Zuverlässigkeit gemeldet.

Die institutionelle Infrastruktur, die es nicht gab

Der Angriff legte auch offen, in welchem Maße die menschlichen Aufsichtsstrukturen, die KI-Fehler abfangen sollten, vor Beginn der Operation ausgehöhlt worden waren. Das Civilian Protection Center of Excellence des Pentagons, das mit der Entwicklung von Doktrin und der Überprüfung von Verfahren zur Minimierung ziviler Opfer bei KI-gestützten Einsätzen betraut ist, sah sein Budget und Personal in den 18 Monaten vor dem Iran-Feldzug um etwa 90 Prozent gekürzt. Das auf zivile Opfer spezialisierte Bewertungsteam von CENTCOM - die Einheit, die für die Überprüfung von Angriffsfolgen und das Erkennen von Mustern zuständig ist, die Untersuchungen erfordern - war von 10 Mitarbeitern auf einen einzigen Offizier reduziert worden.

Diese Kürzungen spiegelten eine breitere institutionelle Haltung wider, in der der großflächige Einsatz von Maven als Effizienzgewinn betrachtet wurde, der die Notwendigkeit paralleler menschlicher Prüfstrukturen verringerte. Die Annahme war, dass KI den Zielerfassungsprozess gleichzeitig schneller und genauer machen würde und damit den für einen verantwortungsvollen Einsatz erforderlichen menschlichen Arbeitsaufwand eher senken als erhöhen würde. Das Ergebnis in Minab legt nahe, dass diese Annahme falsch war.

Der vorgeschriebene Rollout geht weiter

Trotz der Ergebnisse der Untersuchung hat der stellvertretende Verteidigungsminister Steve Feinberg die Formalisierung von Maven als offizielles Program of Record vorangetrieben, mit einem Mandat, das die Einführung in allen Teilstreitkräften bis September 2026 vorschreibt. Nach Angaben von Beamten, die über die Entscheidung informiert wurden, ist die Begründung, dass die Gesamtleistung bei der Zielerfassung im Iran-Feldzug - einschließlich des Angriffs auf Minab - immer noch eine Verbesserung gegenüber dem darstellt, was ohne das System möglich gewesen wäre. Das Tempo, das Maven in den ersten Stunden der Operation bei der Zielerfassung ermöglichte, gilt angesichts der Bedrohungslage als strategische Notwendigkeit.

Kritiker innerhalb und außerhalb des Pentagons argumentieren, dass das September-Mandat Druck erzeugt, noch vor Behebung der im Minab-Bericht festgestellten Probleme mit Aufsicht und Datenaktualität einzuführen. Ein ukrainischer Drohnenentwickler, der mit semiautonomen Systemen unter Kampfbedingungen gearbeitet hat, erklärte nach dem Angriff in einer öffentlichen Stellungnahme, Minab habe "eine vertraute Gefahr des semiautonomen Krieges offengelegt: Das System arbeitet wie spezifiziert, die Spezifikation war falsch, und Kinder sind tot."

Wie Reform aussieht

Innerhalb des Pentagons und unter Forschern der Verteidigungspolitik kursierende Vorschläge umfassen verbindliche Aktualitätsanforderungen für Einträge in Aufklärungsdatenbanken, die für KI-generierte Zielerfassung verwendet werden - kein Eintrag, der älter als 30 Tage ist, dürfte ohne menschliche Prüfung für eine autonome Empfehlung infrage kommen. Andere schlagen vor, Mavens Anzeige des Vertrauenswerts durch Schätzungen von Genauigkeitsspannen zu ersetzen, die bekannte Leistungseinbußen unter ungünstigen Bedingungen widerspiegeln, damit die Bediener ein ehrlicheres Bild von der Zuverlässigkeit erhalten. Die Wiederherstellung der Infrastruktur für Zivilschutz und Opferbewertung, die vor dem Feldzug gekürzt wurde, wird weithin als Voraussetzung für einen verantwortungsvollen weiteren Betrieb des Systems genannt.

Was nicht auf der Reformagenda steht, so Beamte, ist die Aussetzung von Maven bis zu einer umfassenden Überprüfung. Das System ist inzwischen in mehreren Einsatzräumen in die operative Planung eingebettet, und der institutionelle Schwung hinter KI-gestützter Zielerfassung ist erheblich. Die Debatte dreht sich nicht mehr darum, ob KI Zielentscheidungen unterstützen wird, sondern darum, welche Schutzmechanismen vorhanden sein müssen, bevor die Geschwindigkeitsvorteile solcher Systeme die Abwägung überlagern dürfen, die menschliche Überprüfung bietet.

Dieser Artikel basiert auf Berichterstattung von Defense News. Den Originalartikel lesen.

Originally published on defensenews.com