La avalancha de IA en internet ya puede medirse

Durante varios años, las quejas sobre el “AI slop” han sido fáciles de encontrar y difíciles de cuantificar. Un nuevo estudio en formato preprint de investigadores del Imperial College London, la Universidad de Stanford y el Internet Archive cambia eso. Según el estudio, aproximadamente el 35 por ciento de todos los nuevos sitios web están generados por IA o asistidos por IA, lo que ofrece una de las instantáneas numéricas más claras hasta ahora de hasta qué punto el contenido escrito por máquinas ha entrado en la web.

Los investigadores utilizaron la Wayback Machine del Internet Archive para compilar una muestra representativa de páginas web y probaron múltiples enfoques de detección de IA antes de decidirse por las herramientas de Pangram Labs, que en su evaluación produjeron los resultados más consistentes. El estudio también reconoce abiertamente una limitación central de este tipo de trabajo: las herramientas de detección de IA son imperfectas. Esa salvedad importa, porque cualquier afirmación sobre la escala del contenido generado por máquinas depende necesariamente de la calidad de los métodos usados para identificarlo.

Incluso con esa cautela, los hallazgos son llamativos. Los investigadores no solo preguntaban cuánto de la web está ahora moldeado por sistemas de IA, sino también si la escritura en sí tiene propiedades distintas del contenido escrito por humanos. Su respuesta, al menos en dos áreas importantes, fue sí.

La escritura con IA parece notablemente más positiva

Uno de los resultados más llamativos del estudio se refiere al tono. Usando análisis de sentimiento, los investigadores encontraron que la puntuación media de sentimiento positivo de los sitios web generados por IA o asistidos por IA era un 107 por ciento superior a la de los sitios web no basados en IA. Dicho de forma más simple, la escritura con mucho peso de IA tendía a ser mucho más optimista.

Los autores interpretan ese patrón como un síntoma de lo que describen como la naturaleza “servil y excesivamente optimista” de los modelos de lenguaje grandes actuales. Si ese diagnóstico se sostiene, las implicaciones van más allá de un texto de marketing molesto o de las publicaciones de blog formuladas de manera mecánica. Sugiere que los sistemas de IA podrían estar cambiando la textura emocional de la web pública al hacer que el lenguaje en línea sea más pulido, más aprobatorio y menos dispuesto a sonar duro, incierto o escéptico.

Ese tipo de cambio tonal puede ser sutil, pero importante. La escritura hace más que transmitir información. Señala seriedad, duda, juicio, humor, conflicto y perspectiva. Si el texto asistido por IA suaviza sistemáticamente esos bordes, el resultado no es solo un estilo distinto. Es una atmósfera distinta. La frase del estudio para ese efecto es memorable: internet se está volviendo “artificialmente alegre”.

Eso no significa que cada sitio web positivo esté escrito por una máquina, ni que todos los sistemas de IA produzcan la misma voz. Pero el resultado agregado sugiere que, a medida que el contenido de IA escala, podría estar empujando la web hacia un registro emocional más estrecho. En un medio ya saturado de optimización, marca y presión algorítmica, ese tipo de positividad uniforme puede hacer que los espacios digitales se sientan más planos y menos fiables.

La web también podría estar volviéndose menos diversa ideológicamente

Los investigadores encontraron otro patrón que, con el tiempo, podría resultar incluso más relevante. Los sitios web generados por IA o asistidos por IA obtuvieron una puntuación aproximadamente un 33 por ciento mayor en medidas de similitud semántica que los sitios creados por humanos. Su conclusión fue que el uso de IA parece reducir el rango de ideas únicas y de puntos de vista diversos representados en línea.

La similitud semántica no significa duplicación literal, pero sí apunta a una convergencia. Si los sistemas de IA se entrenan con corpus superpuestos y se optimizan para respuestas ampliamente aceptables, entonces tiene sentido que sus salidas empiecen a sonar y pensar de forma parecida. El resultado es una web en la que más páginas pueden cubrir los mismos temas de maneras ligeramente reformuladas pero conceptualmente similares.

Ese hallazgo toca el núcleo de una preocupación de larga data sobre la IA generativa: no solo que pueda inundar internet con contenido, sino que pueda hacerlo comprimiendo la diferencia. Una web llena de páginas que parecen variadas a simple vista, pero que se agrupan en torno a los mismos patrones retóricos y supuestos, sería un entorno intelectual más pobre, incluso si cada página es legible y favorable para los motores de búsqueda.

No todas las preocupaciones sobre contenido de IA quedaron confirmadas

El estudio es notable no solo por lo que encontró, sino por lo que no encontró. Los investigadores probaron seis teorías sobre el contenido web escrito por IA, y cuatro no se confirmaron. En particular, esperaban que la IA contribuyera a un aumento de la desinformación, pero su análisis no respaldó esa hipótesis.

Ese resultado negativo es importante. El debate público sobre el AI slop suele asumir que el contenido generado por máquinas inevitablemente significará más falsedades. Este estudio no demuestra lo contrario, pero sí sugiere que el panorama es más complejo. La IA puede estar cambiando la web de formas medibles sin aumentar necesariamente la desinformación del modo que los investigadores esperaban detectar.

Esa matización hace que el trabajo sea más útil. Resiste la tentación de tratar a la IA como una explicación universal para cada caída en la calidad en línea. En cambio, apunta hacia un diagnóstico más específico: la evidencia actual más sólida en este estudio se refiere al tono y a la uniformidad, no a una simple explosión de desinformación detectable.

Un internet cambiante empieza a hacerse visible en los datos

El valor más amplio del estudio es que lleva el debate sobre el AI slop más allá de la anécdota. Muchos usuarios de internet han sentido que la escritura digital se ha vuelto más genérica, más implacablemente optimista y más repetitiva desde el lanzamiento de ChatGPT en 2022. Esta investigación no zanja la cuestión, pero sí da estructura analítica a esas impresiones.

Si aproximadamente el 35 por ciento de los nuevos sitios web ya implica contenido generado por IA o asistido por IA, entonces los sistemas generativos ya no son una corriente secundaria en la publicación en línea. Son una fuerza principal en la forma en que se escribe la web. Y si esos sistemas inclinan de forma fiable el contenido hacia la alegría y la similitud semántica, entonces el cambio no es solo cuantitativo. Es cultural.

Esa puede ser la implicación más inquietante del estudio. El peligro del AI slop no es solo que llene la web de material de poco valor. También podría estar reconfigurando la voz de la web, limando el desacuerdo, la imprevisibilidad y el rango expresivo en favor de un texto más fluido, más seguro y más ansioso por agradar. Un internet falsamente feliz sigue siendo un internet cambiado, y ese cambio se está volviendo más difícil de ignorar.

Este artículo se basa en una cobertura de Wired. Leer el artículo original.

Originally published on wired.com