சிறிய உரை, பெரிய தாக்கம்

404 Media சுருக்கமாக வெளியிட்ட புதிய ஆய்வு, பயனர்களால் உருவாக்கப்பட்ட மிகக் குறைந்த அளவு உள்ளடக்கமே AI ஆராய்ச்சி கருவிகளின் வெளியீடுகளை கையாள முடியும் என்பதை சுட்டுகிறது. அந்த அறிக்கையின்படி, Cornell ஆராய்ச்சியாளர்கள் Reddit, Wikipedia, Quora, மற்றும் Facebook போன்ற தளங்களில் 13 சொற்கள் அளவுள்ள குறுஞ்செய்திகள்கூட AI முகவர்கள் உருவாக்கும் பதில்களை மாற்ற முடியும்; அவற்றை spam அல்லது scam உள்ளடக்கத்துக்குக் கூட வழிநடத்தலாம் என்று கண்டறிந்துள்ளனர்.

இந்தக் கட்டுரையின் தலைப்பு Deep-research agents can be poisoned via user-generated content என்பதாகும்; இது Cornell University-யின் Hal Triedman, Tingwei Zhang, மற்றும் Vitaly Shmatikov ஆகியோருக்குச் சேர்க்கப்பட்டுள்ளது. நேரடி இணைய உள்ளடக்கத்தை மீட்டெடுக்க அதிகமாகப் பயன்படுத்தப்படும் அமைப்புகள், பொதுத் தளங்களின் மூலம் poisoning-க்கு மிக அதிகமாக வெளிப்படையாக உள்ளன என்பதே இதன் மைய எச்சரிக்கை. அந்த தளங்கள் பயிற்சி அல்லது மேற்கோள் ஆதாரங்களாகவும் செயல்படுகின்றன.

இது இப்போது ஏன் முக்கியம்

இந்த கவலை கோட்பாட்டிலானது அல்ல. AI search மற்றும் deep-research தயாரிப்புகள் நாளுக்குநாள் retrieval-ஐ generation-உடன் இணைத்து, இணையத்திலிருந்து புதிய தகவலை இழுத்து, தங்களுடைய பதில்களில் மூலங்களை மேற்கோள் காட்டுகின்றன. இந்த வடிவமைப்பு தகவல்களின் தற்போதைய தன்மையையும் தடமறிதலையும் மேம்படுத்துவதற்காக உருவாக்கப்பட்டது. ஆனால் அது ஒரு புதிய attack surface-ஐயும் உருவாக்குகிறது: மூலப் பொருளை திட்டமிட்டு இடம்செய்யவோ மாற்றவோ முடிந்தால், உருவாக்கப்படும் பதிலும் அதேபோல் மாற்றப்படலாம்.

அறிக்கையிடப்பட்ட முடிவுகள் இந்த பலவீனம் எவ்வளவு கடுமையானதாக இருக்கலாம் என்பதை அளக்கின்றன. 404 Media-வின் preprint கணக்குப்படி, deep-research agents அனைத்து queries-யில் பாதியளவு user-generated sites-ஐ மேற்கோள் காட்டுகின்றன, மேலும் அனைத்து citations-யில் கிட்டத்தட்ட கால் பங்கிற்கும் user-generated websites-இருந்து வருகிறது. அதனால் forums மற்றும் கூட்டாகத் திருத்தப்படும் வளங்கள் புறநிலை ஆதாரங்கள் அல்ல. அவை மைய உள்ளீடுகள்.

ஒரு poisoned Reddit comment, தொடர்புடைய queries-யின் முழுக் குழுவின் generated outputs-ஐ பாதிக்க முடிந்தால், அந்தப் பிரச்சினை தனிப்பட்ட prompt tricks-ஐ விட பெரிதாகிறது. இது பல பயனர்கள் நடுநிலை அல்லது synthesized என்று கருதக்கூடிய தகவல் அமைப்புகளை திசைதிருப்புவதற்கான அளவுபடுத்தக்கூடிய முறையாக மாறுகிறது.

தேடல் கையாளுதலின் புதிய முனை

இந்த ஆய்வை, பெரும்பாலும் AEO அல்லது AI-engine optimization என விவரிக்கப்படும் வளர்ந்து வரும் துறையுடன் அறிக்கை இணைக்கிறது. அந்த சொல், AI systems அவற்றைக் கண்டுபிடித்து மேற்கோள் காட்ட அதிக வாய்ப்புள்ள இடங்களில் brands அல்லது பிற actors promotional content-ஐ வைப்பதற்கான முயற்சிகளை குறிக்கிறது. பழைய தேடல் காலத்தில், போட்டி search engines-இல் pages-ஐ rank செய்வதிலேயே இருந்தது. retrieval-augmented AI காலத்தில், AI systems பதில்களை உருவாக்கும்போது படிக்கும் documents-ஐ வடிவமைப்பதும் போட்டியின் ஒரு பகுதியாகிறது.

அது பொதுச் சமூகங்களின் ஊக்கங்களை மாற்றுகிறது. Reddit thread, Wikipedia entry, அல்லது Quora answer இனி மனித வாசகர்களுக்கான ஒரு post மட்டுமல்ல. அது machine-generated guidance, product recommendations, அல்லது factual summaries-க்கு raw material-ஆகவும் மாறலாம். அதன் விளைவாக, அந்த இடங்களில் திட்டமிட்டு வடிவமைக்கப்பட்ட உள்ளடக்கத்தை விதைக்க அதிக ஊக்கம் உருவாகிறது.

It Is Trivially Easy to Use Reddit to Manipulate AI Search, Research Suggests
Image: Reddit

இந்த இயக்கத்துடன் தொடர்புடைய promotional material வெள்ளத்தை moderators மற்றும் editors ஏற்கனவே கவனித்துள்ளனர் என்று அறிக்கை கூறுகிறது. Cornell ஆய்வு, அந்த முயற்சிகள் ஏன் செயல்படக்கூடும் என்பதற்கான தொழில்நுட்ப விளக்கத்தை வழங்குகிறது: models-ஐ பாதிக்க மிகப் பெரிய, நுட்பமான campaign அவசியமில்லை. மிகச் சிறிய சேர்க்கையே போதுமானதாக இருக்கலாம்.

Moderation சுமை அதிகரிக்கிறது

இந்தக் கட்டுரையின் மிக முக்கியமான தாக்கங்களில் ஒன்று தொழில்நுட்பத்தைக் கடந்து, நிறுவன ரீதியானதாகும். பயனர்களால் உருவாக்கப்படும் சமூகங்கள் பெரும்பாலும் volunteer moderators அல்லது editors மூலம் நிர்வகிக்கப்படுகின்றன. அந்த சமூகங்கள் AI systems-க்கு upstream infrastructure ஆக மாறினால், அதைக் கையாள தேவையான கருவிகள், வளங்கள், அல்லது அதிகாரம் இல்லாமலேயே, அவர்கள் ஒரு புதிய பாதுகாப்புப் பங்கை ஏற்க வேண்டியிருக்கும்.

“cat-and-mouse” என்ற அறிக்கை விவரிப்பில் இந்தச் சுமை குறிப்பாக தெளிவாகிறது; குறைந்த தரம் அல்லது கையாளும் நோக்கமுள்ள உள்ளடக்கத்தைத் தங்கள் சமூகங்களில் இருந்து விலக்க முயல்வோர்களும், அதே சமூகங்களை AI visibility-க்காக பயன்படுத்த முயல்வோர்களும் இடையே நடக்கும் போட்டி இது. பார்வையாளர்கள் பெரும்பாலும் மனிதர்கள் என்ற காலத்திலும் human moderation கடினமாக இருந்தது. உண்மையான இலக்கு ஒரு automated retrieval system ஆக மாறும்போது, அது இன்னும் கடினமாகலாம்.

மேற்கோள் காட்டப்பட்ட AI பதில்களின் நம்பகத்தன்மையும் இந்தப் பிரச்சினையால் சிக்கலாகிறது. பொது ஆதாரங்களை மேற்கோள் காட்டும் ஒரு பதில், முற்றிலும் உருவாக்கப்பட்ட பதிலை விட நம்பகமானதாகத் தோன்றலாம்; ஆனால் மேற்கோள் காட்டப்பட்ட பொருளே poisoned ஆக இருந்தால், citation ஒரு பாதுகாப்பு நடவடிக்கையாக தோன்றும் அளவுக்கு அது செயல்படாது.

இந்த ஆய்வு என்ன மாற்றுகிறது

கொடுக்கப்பட்ட சுருக்கத்தின் அடிப்படையில், Cornell பணியின் மிக வலுவான மதிப்பு, பரவலாக சந்தேகிக்கப்பட்ட ஒரு பிரச்சினையை மேலும் முறையாக மாற்றுவதில் உள்ளது. அவதானிப்பாளர்கள் சந்தேகத்திற்கிடமான promotional patterns-ஐவும் AI outputs-ஐ கையாளும் முயற்சிகளையும் பார்த்துள்ளனர். இந்த ஆய்வு அந்த நடத்தை இருப்பதையே மட்டும் காட்டவில்லை; அதற்கான தொழில்நுட்ப பாதை எதிர்பாராத அளவுக்கு மலிவானதும் பயனுள்ளதும் என்பதைவும் காட்டுகிறது.

அது AI companies, platform operators, regulators, மற்றும் users-க்கு எல்லோருக்கும் முக்கியமானதாக இருக்க வேண்டும். AI நிறுவனங்களுக்கு வலுவான retrieval filters, source-weighting systems, அல்லது poisoned public content-க்கு எதிரான adversarial testing தேவைப்படலாம். சமூகத் தளங்கள் ஒருங்கிணைந்த கையாளுதலை அடையாளம் காண அதிக அழுத்தத்தை எதிர்கொள்ளலாம். இதற்கிடையில், பயனர்கள் polished AI பதில்களையும் வணிக லாபத்துக்காக optimized செய்யப்பட்ட search results-ஐப் போலவே சந்தேகத்துடன் பார்க்க வேண்டியிருக்கலாம்.

பரந்த பாடம் அசௌகரியமானது, ஆனால் தெளிவானது. AI systems ஆன்லைன் தகவலுக்கான முக்கிய இடைமுகங்களாக மாறும்போது, பொதுஅறிவை வடிவமைக்கும் போராட்டம் மறையாது. அது மேல்நோக்கி, அந்த systems நம்பியிருக்கும் comments, posts, மற்றும் snippets-களுக்குள் நகர்கிறது. 13 சொற்கள் ஒரு பதிலை மாற்ற முடிந்தால், AI search-ஐ சுற்றியுள்ள information ecosystem தோன்றுவதைவிட அதிகமாக மெல்லியதாக உள்ளது.

இந்தக் கட்டுரை 404 Media-வின் செய்திப்படிப்பின் அடிப்படையில் தயாரிக்கப்பட்டது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on 404media.co