இணையத்தில் AI அலை இப்போது அளவிடக்கூடியதாக உள்ளது
பல ஆண்டுகளாக “AI slop” பற்றிய புகார்கள் எளிதில் கிடைத்தாலும், அதை அளவிடுவது கடினமாக இருந்தது. Imperial College London, Stanford University, மற்றும் Internet Archive ஆகியவற்றின் ஆராய்ச்சியாளர்கள் வெளியிட்ட புதிய preprint ஆய்வு இதை மாற்றுகிறது. ஆய்வின் படி, புதிய இணையதளங்களின் சுமார் 35 சதவிகிதம் AI-ஆல் உருவாக்கப்பட்டவை அல்லது AI-உதவியவை; இது இயந்திரம் எழுதிய உள்ளடக்கம் இணையத்தில் எவ்வளவு ஆழமாக புகுந்திருக்கிறது என்பதற்கான இதுவரை கிடைத்த மிகத் தெளிவான எண்ணியல் கண்ணோட்டங்களில் ஒன்றாகும்.
ஆராய்ச்சியாளர்கள் Internet Archive-இன் Wayback Machine-ஐப் பயன்படுத்தி இணையப் பக்கங்களின் பிரதிநிதித்துவமான மாதிரியைச் சேர்த்தனர் மற்றும் பல AI கண்டறிதல் முறைகளைச் சோதித்தபின் Pangram Labs கருவிகளைத் தேர்ந்தெடுத்தனர்; அவர்கள் மதிப்பீட்டில் அவை மிகவும் நிலைத்த முடிவுகளைத் தந்ததாகக் கண்டனர். இந்த ஆய்வு இப்படியான வேலைகளின் முக்கிய வரம்பையும் வெளிப்படையாக ஒப்புக்கொள்கிறது: AI detection tools முழுமையானவை அல்ல. அது முக்கியமானது, ஏனெனில் இயந்திரம் உருவாக்கிய உள்ளடக்கத்தின் அளவைப் பற்றிய எந்தக் கூற்றும் அதைக் கண்டறியும் முறைகளின் தரத்தையே சார்ந்திருக்கும்.
இந்த எச்சரிக்கையிருந்தும், கண்டுபிடிப்புகள் கவனம் ஈர்க்கும் வகையில் உள்ளன. ஆராய்ச்சியாளர்கள் வெபின் எவ்வளவு பகுதி AI அமைப்புகளால் வடிவமைக்கப்படுகிறது என்பதைக் கேட்டதுடன், அந்த எழுதும் பாணி மனிதர்கள் எழுதியவற்றிலிருந்து வேறுபடுகிறதா என்பதையும் ஆராய்ந்தனர். குறைந்தபட்சம் இரண்டு முக்கிய பகுதிகளில் அவர்களின் பதில் ஆம் என்பதாக இருந்தது.
AI எழுத்து குறிப்பிடத்தக்க அளவில் அதிக நேர்மறைத் தன்மை கொண்டதாகத் தெரிகிறது
ஆய்வின் மிகவும் கவனத்தை ஈர்க்கும் முடிவுகளில் ஒன்று tone தொடர்பானது. sentiment analysis-ஐப் பயன்படுத்தி, ஆராய்ச்சியாளர்கள் AI-ஆல் உருவாக்கப்பட்ட அல்லது AI-உதவிய இணையதளங்களின் சராசரி positive sentiment score, AI அல்லாத இணையதளங்களை விட 107 சதவிகிதம் அதிகம் என்று கண்டனர். எளிமையாக சொன்னால், AI-மைய எழுத்து மிகவும் upbeat ஆக இருந்தது.
ஆசிரியர்கள் இந்த pattern-ஐ தற்போதைய பெரிய மொழி மாதிரிகளின் “sycophantic and overoptimistic nature” என்பதற்கான அறிகுறியாகக் கருதுகிறார்கள். இது சரியாக இருந்தால், விளைவுகள் எரிச்சலூட்டும் marketing copy அல்லது சூத்திரத்தன்மை கொண்ட blog posts-களில் மட்டும் முடிவதில்லை. AI systems பொது இணையத்தின் உணர்ச்சி நிழலை மாற்றிக் கொண்டிருக்கக்கூடும்; ஆன்லைன் மொழியை மேலும் polished, மேலும் approving, மேலும் குறைவான கடுமையுடன், குறைவான உறுதிப்பாட்டின்மையுடன், குறைவான சந்தேகத்துடன் ஆக்கிக் கொண்டிருக்கலாம்.
இந்த tone மாற்றம் நுணுக்கமானதாக இருந்தாலும் முக்கியமானதாக இருக்கலாம். எழுத்து தகவலை மட்டும் அனுப்புவதில்லை. அது தீவிரம், சந்தேகம், தீர்ப்பு, நகைச்சுவை, மோதல், மற்றும் பார்வை ஆகியவற்றைச் சைகை செய்கிறது. AI-உதவிய உரை முறையாக அந்த முனைகளை மழுங்கச் செய்தால், அது வெறும் வேறு பாணி அல்ல. வேறு ஒரு சூழல். இந்த விளைவுக்கான ஆய்வின் சொற்றொடர் நினைவில் நிற்கும்: இணையம் “artificially cheerful” ஆக மாறுகிறது.
இதன் பொருள் எல்லா நேர்மறை இணையதளங்களும் இயந்திரம் எழுதியவை என்று அல்ல, அல்லது எல்லா AI systems-உம் ஒரே குரலை உருவாக்குகின்றன என்றும் அல்ல. ஆனால் மொத்தத்தில், AI உள்ளடக்கம் அளவோடு பெருகும்போது, இணையம் ஒரு குறுகிய உணர்ச்சி வரம்புக்குள் தள்ளப்படலாம் என்பதைக் காட்டுகிறது. ஏற்கனவே optimization, branding, மற்றும் algorithmic pressure-ஆல் நிரம்பிய ஒரு medium-இல், இத்தகைய ஒரே மாதிரியான நேர்மறைத் தன்மை டிஜிட்டல் இடங்களை இன்னும் சமமாகவும் குறைவாக நம்பத்தகுந்ததாகவும் உணரச் செய்யலாம்.
இணையம் கருத்தியல் ரீதியாகவும் குறைவாக பல்வகைமையாகி இருக்கலாம்
ஆராய்ச்சியாளர்கள் மேலும் ஒரு pattern-ஐ கண்டனர், அது காலப்போக்கில் இன்னும் முக்கியமானதாக மாறக்கூடும். AI-ஆல் உருவாக்கப்பட்ட அல்லது AI-உதவிய இணையதளங்கள், மனிதர் உருவாக்கிய இணையதளங்களை விட semantic similarity அளவுகளில் சுமார் 33 சதவிகிதம் அதிகமாக மதிப்பெண் பெற்றன. அவர்களின் முடிவு: AI பயன்பாடு ஆன்லைனில் பிரதிபலிக்கப்படும் தனித்துவமான எண்ணங்கள் மற்றும் பல்வேறு பார்வைகளின் வரம்பைக் குறைக்கிறது போலத் தெரிகிறது.
Semantic similarity என்பது சொல் பன்முறை நகலாக்கம் அல்ல, ஆனால் அது convergence-ஐக் காட்டுகிறது. AI systems ஒருவரையொருவர் மிதக்கும் corpora-வில் பயிற்சி பெற்றும், broadly acceptable answers-க்கு optimize செய்யப்பட்டும் இருந்தால், அவற்றின் outputs ஒரே மாதிரியாக ஒலிக்கவும் சிந்திக்கவும் தொடங்குவது இயல்பானதே. இதன் விளைவு, சிறிது வேறு சொற்களில், ஆனால் கருத்தியல் ரீதியாக ஒரே மாதிரியாக, அதே தலைப்புகளைக் கவரும் பக்கங்கள் அதிகரிக்கும் இணையம்.
இந்தக் கண்டுபிடிப்பு generative AI பற்றிய நீண்டகால அச்சத்தின் மையத்தைத் தொடுகிறது: இணையத்தில் உள்ளடக்க வெள்ளம் மட்டுமல்ல, difference-ஐ சுருக்கி அதைச் செய்யும் திறனும். பார்ப்பதற்குத் தனித்தனியாகத் தோன்றும், ஆனால் rhetoric patterns மற்றும் assumptions-இல் ஒரே கூட்டத்தைச் சுற்றி திரளும் பக்கங்களால் நிறைந்த இணையம், ஒவ்வொரு பக்கமும் படிக்க வசதியாகவும் search-friendly ஆகவும் இருந்தாலும், அறிவுத் தரத்தில் ஏழ்மையான சூழலாகவே இருக்கும்.
AI உள்ளடக்கம் பற்றிய எல்லா அச்சங்களும் உறுதிப்படுத்தப்படவில்லை
இந்த ஆய்வு கண்டுபிடித்ததற்காக மட்டுமல்ல, கண்டுபிடிக்காததற்காகவும் முக்கியமானது. ஆராய்ச்சியாளர்கள் AI-எழுதிய இணைய உள்ளடக்கம் குறித்த ஆறு கோட்பாடுகளைச் சோதித்தனர், அதில் நான்கு உறுதிப்படுத்தப்படவில்லை. குறிப்பாக, AI misinformation-ஐ உயர்த்தும் என அவர்கள் எதிர்பார்த்திருந்தனர், ஆனால் அவர்களின் ஆய்வு அந்த கருதுகோளுக்கு ஆதரவளிக்கவில்லை.
அந்த எதிர்மறை முடிவு முக்கியமானது. AI slop குறித்த பொது விவாதம் பெரும்பாலும் இயந்திரம் உருவாக்கிய உள்ளடக்கம் கட்டாயமாக மேலும் பொய்களைத் தரும் என்றே கருதுகிறது. இந்த ஆய்வு அதற்கு எதிரானதை நிரூபிப்பதில்லை, ஆனால் நிலைமை மேலும் சிக்கலானது என்பதைக் காட்டுகிறது. AI இணையத்தை அளவிடக்கூடிய வழிகளில் மாற்றக்கூடும்; ஆனால் ஆராய்ச்சியாளர்கள் கண்டறிய நினைத்த misinformation அளவில் அவ்வளவு அவசியமாக அதை அதிகரிக்க வேண்டியதில்லை.
இந்த நுணுக்கம் பணியை மேலும் பயனுள்ளதாக மாற்றுகிறது. ஆன்லைன் தர வீழ்ச்சியின் ஒவ்வொரு பிரச்சினைக்கும் AI-ஐ ஒரே காரணமாகக் கருதும் ஆசையை இது எதிர்க்கிறது. அதற்குப் பதிலாக, இது இன்னும் குறிப்பான diagnosis-ஐ முன்வைக்கிறது: இந்த ஆய்வில் மிக வலுவான ஆதாரங்கள் tone மற்றும் sameness-இல் இருக்கின்றன, எளிய misinformation வெடிப்பில் அல்ல.
மாறிக்கொண்டிருக்கும் இணையம் இப்போது தரவுகளில் தெரிகிறது
இந்த ஆய்வின் பெரிய மதிப்பு, AI slop விவாதத்தை anecdote-இல் இருந்து வெளியே கொண்டு வருவதாகும். 2022-ல் ChatGPT அறிமுகமானதிலிருந்து பல இணைய பயனர்கள் டிஜிட்டல் எழுத்து அதிகமாக பொதுவானதாக, இடையறாது upbeat ஆக, மற்றும் மீளச்சொல்லும் தன்மையுடன் இருப்பதாக உணர்ந்துள்ளனர். இந்த ஆய்வு அந்த உணர்வை முழுமையாக முடிவுசெய்வதில்லை, ஆனால் அவற்றுக்கு பகுப்பாய்வு அமைப்பை வழங்குகிறது.
புதிய இணையதளங்களின் சுமார் 35 சதவிகிதம் இப்போது AI-ஆல் உருவாக்கப்பட்ட அல்லது AI-உதவிய உள்ளடக்கத்தைப் பயன்படுத்துகின்றன என்றால், generative systems இனி ஆன்லைன் பதிப்பகத்தில் ஒரு பக்க ஓட்டம் அல்ல. அவை இணையம் எப்படிக் எழுதப்படுகிறது என்பதில் முக்கிய சக்தியாக உள்ளன. மேலும் அந்த systems தொடர்ந்து cheerfulness மற்றும் semantic sameness நோக்கி உள்ளடக்கத்தைத் தள்ளினால், மாற்றம் வெறும் அளவுருவாதமாக மட்டும் அல்ல. அது கலாச்சார மாற்றம்.
அதுவே இந்த ஆய்வின் மிகவும் கவலைக்கிடமான விளைவாக இருக்கலாம். AI slop-ன் ஆபத்து என்பது இணையத்தை குறைந்த மதிப்புடைய பொருட்களால் நிரப்புவது மட்டும் அல்ல. அது இணையத்தின் குரலையே மாற்றி, disagreement, unpredictability, மற்றும் expressive range-ஐ மழுங்கச் செய்து, smooth, safe, and eager-to-please என்ற உரையை முன்னிலைப்படுத்தும். ஒரு fake-happy இணையம் கூட ஒரு மாற்றப்பட்ட இணையமே; அந்த மாற்றத்தை கவனிக்காமல் விடுவது நாளுக்கு நாள் கடினமாகிறது.
இந்த கட்டுரை Wired செய்தியின் அடிப்படையில் உள்ளது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on wired.com




