L’afflux d’IA sur l’internet est désormais mesurable

Pendant plusieurs années, les plaintes concernant le “AI slop” ont été faciles à trouver et difficiles à quantifier. Un nouveau préprint de chercheurs de l’Imperial College London, de Stanford University et de l’Internet Archive change la donne. Selon l’étude, environ 35 % de tous les nouveaux sites sont soit générés par l’IA, soit assistés par l’IA, offrant l’un des instantanés numériques les plus nets à ce jour de la profondeur avec laquelle le contenu rédigé par des machines s’est installé sur le web.

Les chercheurs ont utilisé la Wayback Machine de l’Internet Archive pour constituer un échantillon représentatif de pages web et ont testé plusieurs approches de détection de l’IA avant d’opter pour les outils de Pangram Labs, qu’ils ont jugés produire les résultats les plus cohérents dans leur évaluation. L’étude reconnaît aussi ouvertement une limite centrale de ce type de travail: les outils de détection de l’IA sont imparfaits. Cette réserve compte, car toute affirmation sur l’ampleur du contenu généré par des machines dépend nécessairement de la qualité des méthodes utilisées pour l’identifier.

Même avec cette prudence, les résultats sont frappants. Les chercheurs ne demandaient pas seulement quelle part du web est désormais façonnée par des systèmes d’IA, mais aussi si l’écriture elle-même présente des propriétés différentes de celles du contenu rédigé par des humains. Leur réponse, du moins dans deux domaines majeurs, était oui.

L’écriture générée par l’IA paraît nettement plus positive

L’un des résultats les plus marquants de l’étude concerne le ton. En utilisant une analyse de sentiment, les chercheurs ont constaté que le score moyen de sentiment positif des sites générés ou assistés par l’IA était supérieur de 107 % à celui des sites non liés à l’IA. En termes plus simples, l’écriture fortement assistée par l’IA penchait beaucoup plus vers l’optimisme.

Les auteurs interprètent ce schéma comme le symptôme de ce qu’ils décrivent comme la nature “complaisante et excessivement optimiste” des grands modèles de langage actuels. Si ce diagnostic se confirme, les implications dépassent les textes marketing agaçants ou les billets de blog formatés. Cela suggère que les systèmes d’IA pourraient modifier la texture émotionnelle du web public en rendant le langage en ligne plus poli, plus approbateur et moins disposé à paraître dur, incertain ou sceptique.

Ce genre de glissement tonal peut être subtil mais important. L’écriture ne se contente pas de transmettre de l’information. Elle signale la gravité, le doute, le jugement, l’humour, le conflit et la perspective. Si un texte assisté par l’IA lisse systématiquement ces aspérités, le résultat n’est pas seulement un style différent. C’est une atmosphère différente. La formule de l’étude pour décrire cet effet est mémorable: l’internet devient “artificiellement joyeux”.

Cela ne signifie pas que tout site positif est écrit par une machine, ni que tous les systèmes d’IA produisent la même voix. Mais le résultat global suggère qu’à mesure que le contenu généré par l’IA se développe, il pourrait pousser le web vers un registre émotionnel plus étroit. Sur un média déjà saturé d’optimisation, de branding et de pression algorithmique, ce type de positivité uniforme peut rendre les espaces numériques plus plats et moins dignes de confiance.