インターネットへのAIの流入は、いまや測定可能になった

ここ数年、「AI slop」に関する不満は見つけやすい一方で、定量化は難しかった。インペリアル・カレッジ・ロンドン、スタンフォード大学、Internet Archiveの研究者による新しいプレプリント研究は、その状況を変える。研究によると、すべての新規ウェブサイトの約35%はAI生成またはAI支援であり、機械が書いたコンテンツがウェブにどれほど深く入り込んでいるかを示す、これまでで最も明確な数値的スナップショットの一つを提供している。

研究者たちはInternet ArchiveのWayback Machineを使ってウェブページの代表的なサンプルを集め、複数のAI検出手法を試したうえで、評価で最も一貫した結果を示したとしてPangram Labsのツールに絞り込んだ。この研究はまた、この種の作業における中心的な制約、つまりAI検出ツールは完全ではないという点も率直に認めている。この注意書きは重要だ。機械生成コンテンツの規模に関するあらゆる主張は、それを特定する手法の質に必然的に左右されるからだ。

それでも、結果は印象的だ。研究者たちは、ウェブのどの程度がAIシステムによって形作られているかだけでなく、文章そのものが人間の書いたコンテンツとは異なる性質を持つのかどうかも調べた。そして少なくとも二つの主要な分野では、その答えは「はい」だった。

AIによる文章は、明らかによりポジティブに見える

この研究で最も目を引く結果の一つはトーンに関するものだ。感情分析を用いたところ、AI生成またはAI支援のウェブサイトの平均的なポジティブ感情スコアは、非AIサイトのそれより107%高かった。平たく言えば、AI色の強い文章は、はるかに明るい方向に偏っていた。

著者らはこの傾向を、現在の大規模言語モデルが持つ「へつらいがちで、過度に楽観的な性質」の表れだと解釈している。この診断が妥当なら、その影響はうっとうしいマーケティング文や定型的なブログ記事にとどまらない。AIシステムは、オンライン上の言語をより洗練され、より同意的に、そしてより辛辣さや不確かさ、懐疑心を帯びにくいものへと変え、公共のウェブの感情的な質感そのものを変えている可能性がある。

この種のトーンの変化は微妙だが重要だ。文章は情報を運ぶだけではない。真剣さ、疑念、判断、ユーモア、対立、視点を示す。もしAI支援の文章がこれらの輪郭を体系的に滑らかにしてしまうなら、結果は単なる文体の違いではない。空気感そのものが違うのだ。この効果について研究が用いた表現は印象的で、インターネットは「人工的に陽気」になっているという。

これは、すべてのポジティブなサイトが機械によるものだという意味でも、すべてのAIシステムが同じ声を生み出すという意味でもない。しかし、全体としての結果は、AIコンテンツが拡大するにつれて、ウェブをより狭い感情表現へ押しやっている可能性を示している。すでに最適化、ブランディング、アルゴリズム圧力で飽和した媒体では、こうした一様なポジティブさがデジタル空間を平坦で、信頼しにくいものに感じさせうる。

ウェブは思想的にも多様性を失いつつあるかもしれない

研究者たちは、時間が経つほどさらに重大になりうる別の傾向も見つけた。AI生成またはAI支援のウェブサイトは、人間が作成したサイトより、意味的類似性の指標でおよそ33%高いスコアを示した。彼らの結論は、AIの利用がオンライン上で表現される独自のアイデアや多様な視点の幅を狭めているようだというものだった。

意味的類似性は文字通りの重複を意味するわけではないが、収束を示している。AIシステムが重なり合うコーパスで学習され、広く受け入れられる回答に最適化されているなら、その出力が似たような響きや思考に近づいていくのは理にかなっている。その結果として、より多くのページが、少し言い換えられてはいるものの概念的には似通った形で、同じトピックを扱うウェブになる。

この発見は、生成AIに関する長年の懸念の核心に触れている。問題は、AIがインターネットに大量のコンテンツをあふれさせることだけではない。それが差異を圧縮しながら起こりうるという点だ。一見すると多様に見えるが、同じレトリックのパターンと前提に収束するページで満ちたウェブは、各ページが読みやすく検索にも適していたとしても、知的環境としてはより貧しい。

AIコンテンツへのすべての不安が裏付けられたわけではない

この研究が注目されるのは、何を見つけたかだけでなく、何を見つけなかったかにもある。研究者たちはAIが書いたウェブコンテンツについて6つの仮説を検証し、そのうち4つは確認されなかった。とりわけ、AIが誤情報の増加に寄与すると予想していたが、その仮説は分析によって支持されなかった。

この否定的な結果は重要だ。AI slopをめぐる世論は、機械生成コンテンツが必然的により多くの虚偽を意味すると想定しがちだ。この研究はその逆を証明するものではないが、状況はもっと複雑だと示している。AIは、研究者が検出を期待していたような形で誤情報を増やさなくても、測定可能な形でウェブを変えている可能性がある。

そのニュアンスが、この研究をより有用なものにしている。オンラインの質の低下をすべてAIで説明しようとする誘惑に抗っているからだ。代わりに、より具体的な診断を示している。この研究で最も強い証拠があるのは、トーンと同質性であり、検出可能な誤情報の単純な爆発ではない。

変化するインターネットがデータに現れ始めている

この研究の最大の価値は、AI slopをめぐる議論を逸話の域から引き上げることにある。多くのインターネット利用者は、2022年のChatGPT登場以降、デジタルの文章がより一般的で、よりひたすら前向きで、より反復的になったと感じてきた。この研究はその問いに決着をつけるものではないが、その印象に分析的な枠組みを与えている。

もし新規ウェブサイトのおよそ35%がAI生成またはAI支援のコンテンツを含むのであれば、生成システムはもはやオンライン出版の傍流ではない。ウェブがどのように書かれているかを左右する主要な力だ。そして、そうしたシステムがコンテンツを一貫して陽気さと意味的同質性へ傾けているなら、その変化は量的なものだけではない。文化的な変化でもある。

それこそが、この研究の最も不穏な示唆かもしれない。AI slop の危険は、低価値な素材でウェブを埋め尽くすことだけではない。ウェブの声そのものを作り替え、対立、不確実性、表現の幅を削り、より滑らかで、より安全で、より受け入れられやすい文章を優先する方向に向かわせる可能性がある。偽物のように明るいインターネットも、なお変質したインターネットである。そしてその変化は、ますます無視しにくくなっている。

この記事はWiredの報道に基づいています。元記事を読む

Originally published on wired.com