Das nächste Modell von OpenAI zielt direkt auf autonome Arbeit

OpenAI hat GPT-5.5 vorgestellt und beschreibt das Modell als für „echte Arbeit“ gebaut sowie für Agents gedacht, die längere Aufgaben mit weniger Anleitung erledigen können. Auf Grundlage des bereitgestellten Quellenmaterials positioniert das Unternehmen das Modell rund um ein vertrautes, aber in der KI weiterhin schwieriges Versprechen: den Schritt von Chat-Antworten hin zu Systemen, die ein Ziel interpretieren, Kontext sammeln, Werkzeuge nutzen, mit Mehrdeutigkeit umgehen und weiterarbeiten, bis eine Aufgabe abgeschlossen ist.

Zur Veröffentlichung gehört auch GPT-5.5 Pro, eine leistungsfähigere Version, die OpenAI für Arbeiten mit höherer Genauigkeit vorgesehen hat. Beide Modelle waren Berichten zufolge für zahlende ChatGPT- und Codex-Nutzer verfügbar, wobei der API-Zugang ab dem 25. April 2026 ergänzt wurde. Der Quelltext sagt, dass jedes Modell über ein Kontextfenster von einer Million Tokens verfügt, eine Spezifikation, die darauf hindeutet, dass OpenAI mehrstufige Aufgaben anvisiert, die viel Arbeitskontext statt isolierter Prompts erfordern.

Worauf OpenAI die Verbesserungen konzentriert sieht

Dem Quelltext zufolge sieht OpenAI die größten Verbesserungen in vier Bereichen: agentisches Programmieren, Computernutzung, Wissensarbeit und frühe wissenschaftliche Forschung. Diese Kategorien sind wichtig, weil sie alle eine Mischung aus Planung, Werkzeugwahl, Iteration und Verifikation erfordern. Ein Modell, das bei einem Single-Shot-Benchmark gut abschneidet, ist nicht automatisch zuverlässig, wenn es suchen, überarbeiten und Aktionen über mehrere Schritte koordinieren muss.

OpenAIs Beschreibung von GPT-5.5 betont genau diese breitere Betriebsschleife. Das Modell wird als besonders stark beim Schreiben und Debuggen von Code, bei Webrecherchen, Datenanalysen, dem Erstellen von Dokumenten und Tabellen sowie beim Bedienen von Software dargestellt. Anders gesagt, das Unternehmen bewirbt nicht nur bessere Antworten. Es bewirbt eine bessere Aufgabenerledigung.

Diese Unterscheidung wird immer wichtiger, da KI-Unternehmen nicht nur über Benchmark-Werte konkurrieren, sondern darüber, ob sich ihre Modelle in Workflows einbetten lassen, die messbar Zeit sparen. Für Unternehmenskunden und Software-Teams ist der Unterschied zwischen einem Modell, das einen nützlichen Vorschlag liefert, und einem, das eine zusammenhängende Folge von Aktionen abschließen kann, kommerziell relevant.