El aplanamiento del lenguaje
A pesar del énfasis en lo "grande" en los grandes modelos de lenguaje, la diversidad de sus resultados resulta ser notablemente pequeña, y puede estar arrastrando la expresión humana hacia abajo. Un nuevo estudio que examina la adopción generalizada de herramientas de escritura impulsadas por AI ha encontrado evidencia medible de que el texto asistido por AI converge hacia un rango más estrecho de estilos, vocabularios y patrones retóricos que los que produce la escritura solo humana.
Los hallazgos agregan peso empírico a una preocupación que lingüistas, educadores y comentaristas culturales han planteado desde que las herramientas de AI generativo se convirtieron en mainstream: que externalizar la escritura a sistemas de AI entrenados para producir el texto más estadísticamente probable erosionará gradualmente la riqueza y diversidad de la expresión humana.
Midiendo el efecto de homogeneización
El equipo de investigación analizó millones de muestras de texto en múltiples dominios, incluyendo artículos académicos, comunicaciones empresariales, publicaciones en redes sociales, escritura creativa y periodismo, comparando piezas escritas antes y después de la adopción generalizada de asistentes de escritura impulsados por AI.
Los resultados revelaron patrones consistentes de convergencia. Los textos asistidos por AI mostraron diversidad léxica reducida, utilizando un rango más pequeño de palabras distintas en relación con el recuento total de palabras. Las estructuras de oraciones se volvieron más uniformes, gravitando hacia un rango medio de longitudes y complejidad mientras evitaban tanto las construcciones muy simples como las elaboradamente complejas que caracterizan la escritura humana natural.
Más sorprendentemente, los textos asistidos por AI de diferentes autores, culturas e idiomas mostraron mayor similitud entre sí que los textos comparables solo humanos. Las herramientas de AI parecían actuar como una función de promediación estilística, suavizando las peculiaridades individuales, influencias culturales y voz personal que hacen que la escritura humana sea distintiva.
El mecanismo de convergencia
La homogeneización ocurre a través de un mecanismo sencillo: los grandes modelos de lenguaje generan texto prediciendo la palabra siguiente más probable basándose en patrones en sus datos de entrenamiento. Este proceso favorece inherentemente los patrones comunes sobre los raros, las expresiones generalizadas sobre las idiosincrásicas y las estructuras convencionales sobre las experimentales.
Cuando los humanos usan estas herramientas como asistentes de escritura, aceptando completaciones sugeridas o usando AI para redactar versiones iniciales, incorporan este promediación estadística en su propio resultado. Con el tiempo, a medida que la escritura asistida por AI se convierte en la norma, la línea de base de lo que se ve como escritura normal se desplaza hacia los patrones preferidos por AI.
El efecto se agrava por un ciclo de retroalimentación. Conforme más texto generado por AI aparece en línea, se convierte en datos de entrenamiento para futuros modelos de AI. Estos modelos más nuevos aprenden de un corpus cada vez más homogeneizado, produciendo resultados aún más uniformes. Los investigadores describen esto como una espiral de estrechamiento.
Consecuencias culturales e intelectuales
El lenguaje no es meramente un vehículo para transmitir información. Da forma a cómo piensan las personas, qué conceptos pueden expresar y cómo entienden el mundo. Diferentes estilos de escritura reflejan diferentes formas de procesar la experiencia. Cuando esos estilos convergen, la diversidad subyacente del pensamiento también puede converger.
La investigación encontró preocupaciones particulares en la escritura académica, donde la jerga disciplinaria y las convenciones retóricas especializadas sirven funciones epistemológicas importantes. Las herramientas de AI tienden a suavizar estas diferencias disciplinarias, produciendo texto que se lee más como prosa de propósito general que como discurso especializado.
La escritura creativa mostró los efectos más dramáticos. La ficción y la poesía asistidas por AI exhibieron experimentación significativamente menos con forma, voz y estructura narrativa que el trabajo comparable solo humano.
La dimensión multilingüe
El efecto de homogeneización es especialmente pronunciado entre idiomas. Las herramientas de escritura de AI, predominantemente entrenadas con datos en idioma inglés, tienden a imponer patrones retóricos en inglés incluso cuando generan texto en otros idiomas. Los escritores que usan asistencia de AI en mandarín, árabe, español y otros idiomas producen texto mediblemente más similar a patrones en idioma inglés que el texto escrito sin asistencia de AI.
Esto representa una forma de imperialismo lingüístico y cultural que opera a través de la optimización algorítmica en lugar del poder político. Las tradiciones retóricas y convenciones estilísticas que distinguen a diferentes tradiciones literarias están siendo silenciosamente erosionadas por herramientas que han internalizado los patrones dominados por el inglés como predeterminados.
Los defensores de la preservación del idioma han señalado esto como una preocupación seria para los idiomas más pequeños y las tradiciones literarias que carecen de grandes corpus digitales.
Reacción y soluciones
Los defensores de las herramientas de escritura de AI argumentan que la prosa más clara y estandarizada sirve mejor a la comunicación que la escritura idiosincrásica. En contextos profesionales, la consistencia y la claridad se valoran más que el estilo individual.
Sin embargo, los investigadores señalan que la elección entre diversidad y estandarización debe ser consciente, no un efecto secundario accidental del diseño algorítmico. Proponen varias intervenciones: herramientas de AI con modos de diversidad que deliberadamente introducen variación, curación de datos de entrenamiento que prioriza la diversidad estilística, y características de transparencia que destacan dónde los patrones de AI están influyendo en el texto de un usuario.
La investigación en última instancia plantea una pregunta que va más allá de la tecnología: en una era cuando los algoritmos cada vez más mediatizan la expresión humana, ¿quién decide qué cuenta como buena escritura? Si la respuesta es un modelo estadístico optimizando para el promedio, las voces únicas y tradiciones que hacen que el lenguaje humano sea rico pueden ser el costo.
Este artículo se basa en reportajes de Gizmodo. Lee el artículo original.




