Der fehlende Schritt zwischen KI-Hype und Profit

Die Frage nach der Demo

Die wichtigste Frage in der künstlichen Intelligenz ist vielleicht nicht mehr, ob die Systeme beeindruckend sind. Sondern ob sie verlässlichen wirtschaftlichen Wert erzeugen können, sobald sie die Demo, den Coding-Benchmark und das Pitch Deck für Investoren hinter sich lassen. So lautet die Argumentation in einer neuen Analyse von MIT Technology Review, die den aktuellen KI-Moment als vertraute Drei-Schritte-Fantasie rahmt: Technologie bauen, Profit als Folge annehmen und den schwierigen Mittelteil unerklärt lassen.

Der zugrunde liegende Quelltext greift einen bekannten Witz aus South Park auf: „Phase 1: Collect underpants. Phase 2: ? Phase 3: Profit.“ In dieser Neu-Erzählung hat KI Phase eins bereits abgeschlossen, indem sie leistungsfähige Systeme hervorgebracht hat, und die Branche verspricht lautstark Phase drei in Form von Transformation und wirtschaftlichem Auftrieb. Der ungelöste Teil ist Phase zwei: die mühsame Arbeit, aus Leistungsfähigkeit einen routinemäßigen Nutzen im Arbeitsalltag zu machen.

Dieser Rahmen funktioniert, weil er den Widerspruch im Zentrum des gegenwärtigen KI-Booms erfasst. Modelle können schreiben, zusammenfassen, klassifizieren, Code erzeugen und eine wachsende Zahl sprachbasierter Aufgaben bewältigen. Doch beeindruckende Leistung in einem Benchmark oder Pilotprojekt wird nicht automatisch zu Produktivität, Margensteigerung oder dauerhaftem Return on Investment in einer realen Organisation.

Der Artikel legt nahe, dass selbst die besten KI-Systeme außerhalb der Programmierung wirtschaftlich im Arbeitsumfeld noch Schwierigkeiten haben. Dieser Unterschied ist wichtig. Programmierung hat sich als einer der stärksten frühen kommerziellen Anwendungsfälle für generative KI erwiesen, weil die Ausgaben digital sind, die Workflows iterativ und die Nutzer oft sehr gut darin sind, Ergebnisse zu bewerten. Viele andere Bereiche sind weniger tolerant. Fehler verursachen höhere Kosten, Aufsicht ist langsamer, Aufgaben sind weniger strukturiert, und die Integration in bestehende Prozesse ist schwieriger.

Die Analyse verweist auf zwei aktuelle Studien als Beispiele für diese Lücke. Eine von Anthropic sagte voraus, welche Berufsgruppen von Large Language Models am stärksten betroffen sein könnten, und nannte dabei Rollen wie Manager, Architekten und Beschäftigte in den Medien, während sie für Gärtner, Bauarbeiter und Beschäftigte im Gastgewerbe einen geringeren Einfluss annahm. Der Artikel betont jedoch, dass solche Prognosen im Kern weiterhin nur Vermutungen über die Passung von Aufgaben sind, kein Beweis für tatsächliche Leistung im Arbeitsalltag.

Das ist ein entscheidender Unterschied. Ein Modell kann theoretisch bei einer Aufgabe helfen und dennoch an den praktischen Hürden scheitern, die darüber entscheiden, ob ein Arbeitgeber es breit einsetzt. Zu diesen Hürden gehören Zuverlässigkeit, Compliance, Überwachungskosten, Nutzervertrauen, Neugestaltung von Arbeitsabläufen und die einfache Frage, ob die Nutzung des Systems schneller oder billiger ist als die bisherigen Methoden.

Dasselbe Problem überschattet viele der großartigsten KI-Versprechen. Führungskräfte und Forschende können die Technologie als wirtschaftlich transformativ beschreiben, und womöglich liegen sie damit eines Tages richtig. Aber eine Transformation zählt erst dann, wenn Organisationen den Wert in der Produktion wiederholt realisieren können. Das heißt, der eigentliche Wettbewerb könnte nicht darum gehen, wer das fortschrittlichste Modell hat. Er könnte sich darum drehen, wer die fehlende Mittelschicht zwischen Modelloutput und Geschäftsergebnis definieren, operationalisieren und skalieren kann.

Diese Schicht könnte Prozessumgestaltung, Regulierung, Aufsichtsmechanismen, Softwareoberflächen, Preismodelle, Schulungen und ein klareres Verständnis dessen umfassen, wo KI menschliche Arbeit sinnvoll ergänzt, statt sie zu verkomplizieren. Der MIT Technology Review-Beitrag merkt an, dass verschiedene Lager bereits unterschiedliche Antworten in diesen Mittelraum projizieren. Mit Pause AI verbundene Aktivisten sehen Regulierung als unverzichtbar. Befürworter gehen oft einfach über die Unsicherheit hinweg, weil sie stärker auf das Ziel als auf den Weg fokussiert sind.

In Wirklichkeit ist der Weg die eigentliche Geschichte. Jede große Technologie-Welle am Arbeitsplatz war auf ergänzende Systeme rund um das Werkzeug selbst angewiesen. Die Tabellenkalkulation war wichtig, aber ebenso die Geschäftsprozesse, die sie aufnahmen. Das Internet war wichtig, aber ebenso Zahlungen, Logistik, Standards und Nutzungsgewohnheiten. KI wird wahrscheinlich demselben Muster folgen. Das Modell ist nur ein Teil der Wertschöpfungskette.

Deshalb ist der Markt derzeit voller Spannungen. Unternehmen haben bereits viel in Modelle, Rechenleistung, Integrationen und Pilotprojekte investiert. Sie stehen unter Druck zu zeigen, dass diese Ausgaben mehr als nur Neuheit erzeugen. Wenn die wirtschaftliche Logik weiterhin nur für einen engen Anwendungsbereich wirklich stark ist, dann wird der Weg von Hype zu breiter Profitabilität langsamer und selektiver verlaufen, als viele Prognosen vermuten lassen.

Der fehlende Schritt ist also kein nebensächliches Implementierungsdetail. Er ist das zentrale Geschäftsproblem der KI-Ära. Solange Unternehmen nicht mit Belegen erklären können, wie sie von technischer Möglichkeit zu wiederholbaren Verbesserungen im Arbeitsalltag gelangen, wird der Sektor weiter zwischen echten Durchbrüchen und überzogenen Erwartungen pendeln. KI ist an dem Punkt angekommen, an dem ihre größte Herausforderung nicht mehr darin besteht, immer mehr Fähigkeiten zu bauen. Es geht darum, Fähigkeiten wirksam werden zu lassen.

Dieser Artikel basiert auf Berichterstattung von MIT Technology Review. Zum Originalartikel.

Originally published on technologyreview.com