इंटरनेट पर AI की बाढ़ अब मापी जा सकती है

कई वर्षों से “AI slop” की शिकायतें ढूँढना आसान था, लेकिन उनका आकलन करना कठिन। Imperial College London, Stanford University, और Internet Archive के शोधकर्ताओं की एक नई प्रीप्रिंट स्टडी इसे बदल देती है। अध्ययन के अनुसार, लगभग 35 प्रतिशत नई वेबसाइटें या तो AI-जनित हैं या AI-सहायित, जो इस बात का अब तक का सबसे स्पष्ट संख्यात्मक स्नैपशॉट देता है कि मशीन-लिखित सामग्री वेब में कितनी गहराई तक प्रवेश कर चुकी है।

शोधकर्ताओं ने Internet Archive की Wayback Machine का उपयोग करके वेब पेजों का एक प्रतिनिधि नमूना तैयार किया और AI पहचान के कई तरीकों को परखा, फिर Pangram Labs के टूल्स पर पहुँचे, जिन्हें उन्होंने अपने मूल्यांकन में सबसे सुसंगत पाया। अध्ययन एक केंद्रीय सीमा को भी खुलकर स्वीकार करता है: AI डिटेक्शन टूल्स परिपूर्ण नहीं होते। यह सावधानी महत्वपूर्ण है, क्योंकि मशीन-जनित सामग्री के पैमाने का कोई भी दावा उसे पहचानने वाली विधियों की गुणवत्ता पर निर्भर करता है।

इस चेतावनी के बावजूद निष्कर्ष चौंकाने वाले हैं। शोधकर्ता केवल यह नहीं देख रहे थे कि वेब का कितना हिस्सा AI सिस्टम से आकार ले रहा है, बल्कि यह भी कि क्या इस लेखन के गुण मानव-लेखित सामग्री से अलग हैं। कम से कम दो बड़े क्षेत्रों में उनका उत्तर हाँ था।

AI लेखन स्पष्ट रूप से अधिक सकारात्मक दिखता है

अध्ययन के सबसे ध्यान खींचने वाले नतीजों में से एक स्वर से जुड़ा है। sentiment analysis का उपयोग करते हुए, शोधकर्ताओं ने पाया कि AI-जनित या AI-सहायित वेबसाइटों का औसत positive sentiment score गैर-AI वेबसाइटों की तुलना में 107 प्रतिशत अधिक था। साधारण भाषा में कहें तो AI-प्रधान लेखन बहुत अधिक upbeat झुकाव वाला था।

लेखकों ने इस पैटर्न को वर्तमान बड़े भाषा मॉडलों की “sycophantic and overoptimistic nature” का लक्षण बताया है। यदि यह आकलन सही है, तो इसके प्रभाव केवल परेशान करने वाली marketing copy या फार्मूला-जैसी blog posts तक सीमित नहीं हैं। इसका अर्थ यह है कि AI सिस्टम सार्वजनिक वेब के भावनात्मक स्वर को बदल रहे हो सकते हैं, ऑनलाइन भाषा को अधिक polished, अधिक approving, और कम कठोर, कम अनिश्चित, और कम संशयात्मक बना रहे हैं।

ऐसा tonal shift सूक्ष्म लेकिन महत्वपूर्ण हो सकता है। लेखन केवल जानकारी पहुँचाने का काम नहीं करता। यह गंभीरता, संदेह, निर्णय, हास्य, संघर्ष और दृष्टिकोण का संकेत भी देता है। यदि AI-सहायित पाठ व्यवस्थित रूप से इन किनारों को समतल करता है, तो परिणाम केवल अलग शैली नहीं, बल्कि अलग वातावरण है। अध्ययन इस प्रभाव के लिए एक यादगार वाक्यांश देता है: इंटरनेट “artificially cheerful” बनता जा रहा है।

इसका अर्थ यह नहीं कि हर सकारात्मक वेबसाइट मशीन-लिखित है, या हर AI सिस्टम एक ही आवाज़ पैदा करता है। लेकिन सामूहिक स्तर पर परिणाम यह संकेत देता है कि AI सामग्री के पैमाने के साथ वेब एक संकीर्ण भावनात्मक दायरे की ओर धकेला जा सकता है। ऐसे माध्यम में, जो पहले से ही optimization, branding, और algorithmic pressure से भरा है, यह तरह की समान सकारात्मकता डिजिटल जगहों को अधिक सपाट और कम भरोसेमंद महसूस करा सकती है।

वेब वैचारिक रूप से भी कम विविध हो सकता है

शोधकर्ताओं ने एक और पैटर्न पाया जो समय के साथ और अधिक महत्वपूर्ण साबित हो सकता है। AI-जनित या AI-सहायित वेबसाइटों ने मानव-निर्मित वेबसाइटों की तुलना में semantic similarity के मानकों पर लगभग 33 प्रतिशत अधिक स्कोर किया। उनका निष्कर्ष था कि AI का उपयोग ऑनलाइन प्रतिनिधित्व किए गए अनूठे विचारों और विविध दृष्टिकोणों की सीमा को कम करता दिखता है।

Semantic similarity का अर्थ शब्दशः duplication नहीं है, लेकिन यह convergence की ओर संकेत करता है। यदि AI सिस्टम एक-दूसरे से ओवरलैप करने वाले corpora पर प्रशिक्षित हैं और broadly acceptable answers के लिए optimized हैं, तो स्वाभाविक है कि उनके outputs एक-दूसरे जैसे लगने और सोचने लगें। इसका परिणाम ऐसा वेब हो सकता है जहाँ अधिक पेज थोड़े अलग शब्दों में, लेकिन वैचारिक रूप से समान रूप से, एक ही विषयों को कवर करते हैं।

यह निष्कर्ष generative AI को लेकर लंबे समय से चली आ रही चिंता के मूल तक जाता है: सिर्फ़ इंटरनेट में सामग्री की बाढ़ आने की नहीं, बल्कि यह कि वह विविधता को compress करते हुए ऐसा कर सकती है। एक ऐसा वेब जहाँ पेज पहली नज़र में अलग दिखें लेकिन उन्हीं rhetorical patterns और assumptions के आसपास समूहित हों, बौद्धिक रूप से गरीब माहौल होगा, चाहे हर पेज पठनीय और search-friendly ही क्यों न हो।

AI सामग्री को लेकर हर डर सही साबित नहीं हुआ

यह अध्ययन सिर्फ़ अपने निष्कर्षों के लिए ही नहीं, बल्कि उन बातों के लिए भी उल्लेखनीय है जो इसमें साबित नहीं हुईं। शोधकर्ताओं ने AI-लिखी वेब सामग्री को लेकर छह सिद्धांतों की जाँच की, और चार पुष्टि नहीं हुए। सबसे विशेष रूप से, उन्हें उम्मीद थी कि AI misinformation बढ़ाएगा, लेकिन उनके विश्लेषण ने उस परिकल्पना का समर्थन नहीं किया।

यह नकारात्मक परिणाम महत्वपूर्ण है। AI slop के बारे में सार्वजनिक बहस अक्सर मान लेती है कि मशीन-जनित सामग्री अनिवार्य रूप से अधिक झूठ लेकर आएगी। यह अध्ययन इसके उलट को सिद्ध नहीं करता, लेकिन यह जरूर दिखाता है कि तस्वीर अधिक जटिल है। AI वेब को मापने योग्य तरीकों से बदल सकता है, बिना जरूरी रूप से misinformation को उस रूप में बढ़ाए जिसकी शोधकर्ताओं ने पहचान की उम्मीद की थी।

यह बारीकी काम को अधिक उपयोगी बनाती है। यह AI को ऑनलाइन गुणवत्ता में हर गिरावट का सार्वभौमिक कारण मानने के प्रलोभन का विरोध करती है। इसके बजाय यह एक अधिक विशिष्ट निदान देती है: इस अध्ययन में सबसे मजबूत मौजूदा सबूत स्वर और एकरूपता से जुड़े हैं, न कि detectable misinformation के साधारण विस्फोट से।

बदलता इंटरनेट डेटा में दिखाई देने लगा है

इस अध्ययन का बड़ा मूल्य यह है कि यह AI slop बहस को anecdote से आगे ले जाता है। 2022 में ChatGPT के लॉन्च के बाद से कई इंटरनेट उपयोगकर्ताओं को महसूस हुआ है कि डिजिटल लेखन अधिक सामान्य, अधिक लगातार upbeat, और अधिक दोहरावदार हो गया है। यह शोध उस प्रश्न को अंतिम रूप से हल नहीं करता, लेकिन उन छापों को विश्लेषणात्मक ढाँचा देता है।

यदि लगभग 35 प्रतिशत नई वेबसाइटें अब AI-जनित या AI-सहायित सामग्री शामिल करती हैं, तो generative systems अब ऑनलाइन प्रकाशन में कोई साइड करंट नहीं रहे। वे इस बात की एक बड़ी ताकत हैं कि वेब कैसे लिखा जा रहा है। और यदि वे सिस्टम लगातार सामग्री को cheerfulness और semantic sameness की ओर झुकाते हैं, तो बदलाव सिर्फ़ मात्रात्मक नहीं, सांस्कृतिक भी है।

शायद यही अध्ययन का सबसे असहज निष्कर्ष है। AI slop का खतरा केवल यह नहीं कि वह वेब को कम-उपयोगी सामग्री से भर देता है। यह वेब की आवाज़ को भी बदल सकता है, असहमति, अप्रत्याशितता, और अभिव्यक्ति-सीमा को कम करते हुए ऐसे पाठ को बढ़ावा दे सकता है जो अधिक smooth, अधिक safe, और अधिक pleasing हो। एक fake-happy इंटरनेट फिर भी एक बदला हुआ इंटरनेट है, और यह बदलाव अब अनदेखा करना कठिन होता जा रहा है।

यह लेख Wired की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on wired.com