Der KI-Zustrom ins Internet ist jetzt messbar

Seit mehreren Jahren sind Klagen über „AI slop“ leicht zu finden, aber schwer zu quantifizieren. Eine neue Preprint-Studie von Forschern am Imperial College London, der Stanford University und dem Internet Archive ändert das. Laut der Studie sind ungefähr 35 Prozent aller neuen Websites entweder KI-generiert oder KI-unterstützt und liefern damit eines der bislang klarsten numerischen Bilder davon, wie tief maschinell geschriebene Inhalte ins Web vorgedrungen sind.

Die Forscher nutzten die Wayback Machine des Internet Archive, um eine repräsentative Stichprobe von Webseiten zusammenzustellen, und testeten mehrere Ansätze zur KI-Erkennung, bevor sie sich für Werkzeuge von Pangram Labs entschieden, die in ihrer Bewertung die konsistentesten Ergebnisse lieferten. Die Studie räumt auch offen eine zentrale Einschränkung dieser Art von Arbeit ein: KI-Erkennungstools sind unvollkommen. Diese Einschränkung ist wichtig, denn jede Aussage über das Ausmaß maschinell erzeugter Inhalte hängt zwangsläufig von der Qualität der Methoden ab, mit denen sie identifiziert werden.

Selbst mit dieser Vorsicht sind die Ergebnisse bemerkenswert. Die Forscher wollten nicht nur wissen, wie stark das Web inzwischen von KI-Systemen geprägt ist, sondern auch, ob der Text selbst andere Eigenschaften aufweist als von Menschen verfasste Inhalte. Ihre Antwort war in mindestens zwei großen Bereichen: ja.

KI-Texte wirken deutlich positiver

Eines der auffälligsten Ergebnisse der Studie betrifft den Ton. Mithilfe einer Sentiment-Analyse fanden die Forscher heraus, dass der durchschnittliche positive Sentiment-Score von KI-generierten oder KI-unterstützten Websites 107 Prozent höher war als der von nicht-KI-Websites. In einfacheren Worten: KI-lastige Texte waren deutlich optimistischer.

Die Autoren interpretieren dieses Muster als Symptom dessen, was sie als die „unterwürfige und übermäßig optimistische Natur“ aktueller großer Sprachmodelle beschreiben. Wenn diese Diagnose zutrifft, reichen die Folgen über nervige Marketingtexte oder schematische Blogbeiträge hinaus. Sie legt nahe, dass KI-Systeme die emotionale Textur des öffentlichen Webs verändern könnten, indem sie die Online-Sprache geschliffener, zustimmender und weniger geneigt machen, hart, unsicher oder skeptisch zu klingen.

Eine solche Tonverschiebung kann subtil, aber wichtig sein. Schreiben vermittelt nicht nur Informationen. Es signalisiert Ernsthaftigkeit, Zweifel, Urteil, Humor, Konflikt und Perspektive. Wenn KI-gestützter Text diese Kanten systematisch glättet, ist das Ergebnis nicht nur ein anderer Stil. Es ist eine andere Atmosphäre. Der prägnante Begriff der Studie dafür lautet, dass das Internet „künstlich fröhlich“ wird.

Das bedeutet nicht, dass jede positive Website maschinell geschrieben ist, noch dass jedes KI-System dieselbe Stimme produziert. Doch das Gesamtergebnis legt nahe, dass mit der Skalierung von KI-Inhalten das Web in ein engeres emotionales Register gedrängt werden könnte. In einem Medium, das bereits von Optimierung, Branding und algorithmischem Druck gesättigt ist, kann diese Art uniformer Positivität digitale Räume flacher und weniger vertrauenswürdig wirken lassen.

Das Web könnte auch ideologisch weniger vielfältig werden

Die Forscher fanden ein weiteres Muster, das sich mit der Zeit als noch folgenreicher erweisen könnte. KI-generierte oder KI-unterstützte Websites erzielten bei Maßen semantischer Ähnlichkeit rund 33 Prozent höhere Werte als von Menschen erstellte Websites. Ihr Schluss war, dass der Einsatz von KI offenbar die Bandbreite einzigartiger Ideen und unterschiedlicher Standpunkte im Netz verringert.

Semantische Ähnlichkeit bedeutet nicht wörtliche Duplizierung, deutet aber auf Konvergenz hin. Wenn KI-Systeme auf überlappenden Korpora trainiert und auf allgemein akzeptable Antworten optimiert werden, ist es plausibel, dass ihre Ausgaben beginnen, sich im Klang und Denken anzugleichen. Das Ergebnis ist ein Web, in dem mehr Seiten dieselben Themen in leicht umformulierten, aber konzeptionell ähnlichen Varianten behandeln.

Diese Erkenntnis trifft den Kern einer langjährigen Sorge über generative KI: nicht nur, dass sie das Internet mit Inhalten fluten kann, sondern dass sie dies unter gleichzeitiger Komprimierung von Unterschieden tun kann. Ein Web voller Seiten, die auf den ersten Blick vielfältig erscheinen, sich aber um dieselben rhetorischen Muster und Annahmen gruppieren, wäre ein ärmeres intellektuelles Umfeld, selbst wenn jede Seite lesbar und suchfreundlich ist.

Nicht jede Angst vor KI-Inhalten wurde bestätigt

Bemerkenswert ist die Studie nicht nur wegen dessen, was sie gefunden hat, sondern auch wegen dessen, was sie nicht gefunden hat. Die Forscher testeten sechs Theorien über von KI geschriebene Webinhalte, und vier davon wurden nicht bestätigt. Besonders auffällig war, dass sie erwartet hatten, KI würde zu mehr Desinformation beitragen, doch ihre Analyse stützte diese Hypothese nicht.

Dieses negative Ergebnis ist wichtig. Die öffentliche Debatte über AI slop geht oft davon aus, dass maschinell erzeugte Inhalte zwangsläufig mehr Falschinformationen bedeuten. Diese Studie beweist das Gegenteil nicht, legt aber nahe, dass das Bild komplizierter ist. KI könnte das Web auf messbare Weise verändern, ohne notwendigerweise die Desinformation in der von den Forschern erwarteten Weise zu erhöhen.

Diese Nuance macht die Arbeit nützlicher. Sie widersteht der Versuchung, KI als universelle Erklärung für jeden Rückgang der Online-Qualität zu behandeln. Stattdessen deutet sie auf eine spezifischere Diagnose hin: Die stärksten Belege in dieser Studie betreffen Ton und Gleichförmigkeit, nicht eine einfache Explosion nachweisbarer Desinformation.

Ein sich veränderndes Internet wird in den Daten sichtbar

Der größte Wert der Studie liegt darin, die Debatte über AI slop über Anekdoten hinauszuführen. Viele Internetnutzer haben das Gefühl, dass digitale Texte seit dem Start von ChatGPT im Jahr 2022 generischer, unablässig positiver und repetitiver geworden sind. Diese Forschung beantwortet die Frage nicht abschließend, gibt diesen Eindrücken aber eine analytische Struktur.

Wenn rund 35 Prozent der neuen Websites inzwischen KI-generierte oder KI-unterstützte Inhalte enthalten, dann sind generative Systeme kein Nebenzweig des Online-Publishings mehr. Sie sind eine zentrale Kraft dafür, wie das Web geschrieben wird. Und wenn diese Systeme Inhalte zuverlässig in Richtung Fröhlichkeit und semantischer Gleichförmigkeit kippen, dann ist die Veränderung nicht nur quantitativ. Sie ist kulturell.

Das ist womöglich die beunruhigendste Implikation der Studie. Die Gefahr von AI slop besteht nicht nur darin, das Web mit minderwertigem Material zu füllen. Sie könnte auch die Stimme des Webs umformen, Widerspruch, Unvorhersehbarkeit und Ausdrucksbreite abschleifen zugunsten von Text, der glatter, sicherer und gefälliger ist. Ein künstlich fröhliches Internet ist immer noch ein verändertes Internet, und die Verschiebung wird schwerer zu ignorieren.

Dieser Artikel basiert auf einer Berichterstattung von Wired. Zum Originalartikel.

Originally published on wired.com