Die Abflachung der Sprache

Trotz aller Betonung des Großen in großen Sprachmodellen stellt sich heraus, dass die Vielfalt ihrer Ausgaben bemerkenswert klein ist, und sie könnte die menschliche Ausdrucksweise mit sich herunterziehen. Eine neue Studie zur weit verbreiteten Übernahme von KI-Schreibwerkzeugen hat messbare Beweise gefunden, dass von KI unterstützte Texte zu einer engeren Palette von Stilen, Wortschätzen und rhetorischen Mustern konvergieren als Texte, die nur von Menschen verfasst werden.

Die Erkenntnisse verleihen einer Besorgnis empirisches Gewicht, die Linguisten, Pädagogen und Kulturkommentatoren seit dem Mainstream-Eintritt von generativen KI-Werkzeugen geäußert haben: dass das Auslagern des Schreibens an KI-Systeme, die darauf trainiert sind, den statistisch wahrscheinlichsten Text zu produzieren, allmählich den Reichtum und die Vielfalt der menschlichen Ausdrucksweise erodieren wird.

Messung des Vereinheitlichungseffekts

Das Forschungsteam analysierte Millionen von Textproben in mehreren Bereichen, darunter akademische Arbeiten, Geschäftskommunikation, Social-Media-Beiträge, kreatives Schreiben und Journalismus, und verglich Stücke, die vor und nach der weit verbreiteten Übernahme von KI-Schreibassistenten geschrieben wurden.

Die Ergebnisse zeigten konsistente Konvergenzmuster. KI-unterstützte Texte wiesen eine reduzierte lexikalische Vielfalt auf und verwendeten einen kleineren Bestand an unterschiedlichen Wörtern im Verhältnis zur Gesamtwortzahl. Satzstrukturen wurden gleichförmiger und tendierten zu einer mittleren Länge und Komplexität, während sie sowohl sehr einfache als auch aufwendig komplexe Konstruktionen vermieden, die natürliches menschliches Schreiben kennzeichnen.

Am auffälligsten zeigten KI-unterstützte Texte von verschiedenen Autoren, Kulturen und Sprachen eine größere Ähnlichkeit zueinander als vergleichbare nur von Menschen geschriebene Texte. Die KI-Werkzeuge schienen als stilistische Durchschnittsfunktion zu wirken und glätteten die individuellen Eigenheiten, kulturellen Einflüsse und persönliche Stimme, die menschliches Schreiben auszeichnen.

Der Mechanismus der Konvergenz

Die Vereinheitlichung erfolgt durch einen unkomplizierten Mechanismus: Große Sprachmodelle generieren Text, indem sie das wahrscheinlichste nächste Wort auf Basis von Mustern in ihren Trainingsdaten vorhersagen. Dieser Prozess bevorzugt von Natur aus häufige Muster gegenüber seltenen, Mainstream-Ausdrücke gegenüber idiosynkratischen und konventionelle Strukturen gegenüber experimentellen.

Wenn Menschen diese Werkzeuge als Schreibassistenten nutzen, akzeptieren Vervollständigungsvorschläge oder KI zum Verfassen von Anfassungen verwenden, integrieren sie diese statistische Mittelwertbildung in ihre eigene Leistung. Mit der Zeit, wenn KI-unterstütztes Schreiben zur Norm wird, verschiebt sich die Baseline dessen, wie normales Schreiben aussieht, zu den bevorzugten Mustern der KI.

Der Effekt wird durch eine Rückkopplungsschleife verschärft. Mit mehr KI-generiertem Text online wird dieser zu Trainingsdaten für zukünftige KI-Modelle. Diese neueren Modelle lernen aus einem zunehmend vereinheitlichten Korpus und erzeugen sogar einheitlichere Ausgaben. Die Forscher bezeichnen dies als eine verengende Spirale.

Kulturelle und intellektuelle Konsequenzen

Sprache ist nicht bloß ein Vehikel zur Informationsvermittlung. Sie prägt, wie Menschen denken, welche Konzepte sie ausdrücken können und wie sie die Welt verstehen. Verschiedene Schreibstile spiegeln unterschiedliche Weisen der Erfahrungsverarbeitung wider. Wenn diese Stile konvergieren, könnte auch die zugrunde liegende Gedankenvielfalt konvergieren.

Die Forschung fand besondere Bedenken in akademischen Texten, wo disziplinärer Jargon und spezialisierte rhetorische Konventionen wichtige epistemische Funktionen erfüllen. KI-Werkzeuge neigen dazu, diese fachlichen Unterschiede zu glätten und Text zu produzieren, der eher wie allgemeine Prosa als spezialisierter Diskurs wirkt.

Kreatives Schreiben zeigte die dramatischsten Effekte. KI-unterstützte Belletristik und Poesie zeigten signifikant weniger Experimentieren mit Form, Stimme und Erzählstruktur als vergleichbare nur von Menschen verfasste Werke.

Die mehrsprachige Dimension

Der Vereinheitlichungseffekt ist über Sprachen hinweg besonders ausgeprägt. KI-Schreibwerkzeuge, überwiegend auf englischsprachigen Daten trainiert, neigen dazu, englische rhetorische Muster auch bei der Textgenerierung in anderen Sprachen durchzusetzen. Schriftsteller, die KI-Unterstützung in Mandarin, Arabisch, Spanisch und anderen Sprachen nutzen, erzeugten messbar Text, der englischsprachigen Mustern ähnlicher ist als Text, der ohne KI-Unterstützung geschrieben wurde.

Dies stellt eine Form des sprachlichen und kulturellen Imperialismus dar, die durch algorithmische Optimierung anstelle von politischer Macht funktioniert. Die rhetorischen Traditionen und stilistischen Konventionen, die verschiedene Literaturtraditionen auszeichnen, werden leise von Werkzeugen erodiert, die englischdominante Muster als Standard internalisiert haben.

Verfechter der Sprachbewahrung haben dies als ernsthafte Besorgnis für kleinere Sprachen und literarische Traditionen gekennzeichnet, denen große digitale Korpora fehlen.

Widerstand und Lösungen

Befürworter von KI-Schreibwerkzeugen argumentieren, dass klarere, standardisiertere Prosa die Kommunikation besser fördert als idiosynkratisches Schreiben. In professionellen Kontexten werden Konsistenz und Klarheit dem individuellen Stil vorgezogen.

Die Forscher weisen jedoch darauf hin, dass die Wahl zwischen Vielfalt und Standardisierung bewusst erfolgen sollte und kein zufälliger Nebeneffekt von Algorithmusdesign. Sie schlagen mehrere Interventionen vor: KI-Werkzeuge mit Vielfaltsmodi, die bewusst Variation einführen, die Kurierung von Trainingsdaten mit Fokus auf stilistische Vielfalt und Transparenzfunktionen, die hervorheben, wo KI-Muster die Schreiben eines Nutzers beeinflussen.

Die Forschung wirft letztendlich eine Frage auf, die über Technologie hinausgeht: In einer Zeit, in der Algorithmen zunehmend menschliche Ausdrucksweise vermitteln, wer entscheidet, was als gutes Schreiben zählt? Wenn die Antwort ein statistisches Modell ist, das für den Durchschnitt optimiert, könnten die einzigartigen Stimmen und Traditionen, die menschliche Sprache bereichern, der Preis sein.

Dieser Artikel basiert auf einer Berichterstattung von Gizmodo. Lesen Sie den Originalartikel.