अभ्यास: Reddit snippets AI search poison करू शकतात

लहान मजकूर, मोठा प्रभाव

404 Media च्या संक्षेपित अहवालानुसार, वापरकर्त्यांनी तयार केलेल्या आश्चर्यकारकपणे कमी प्रमाणातील मजकुरामुळेही AI research tools चे आउटपुट manipulate होऊ शकतात, असे नवे संशोधन सूचित करते. त्या अहवालानुसार, Cornell संशोधकांनी Reddit, Wikipedia, Quora, आणि Facebook सारख्या साइट्सवरील केवळ 13 शब्दांइतके छोटे मजकूर तुकडे AI agents काय तयार करतात ते बदलू शकतात, त्यांना spam किंवा scam content कडे ढकलू शकतात, असे आढळले.

या पेपरचे शीर्षक Deep-research agents can be poisoned via user-generated content असे आहे आणि तो Cornell University मधील Hal Triedman, Tingwei Zhang, आणि Vitaly Shmatikov यांच्याकडे श्रेय दिला जातो. सार्वजनिक प्लॅटफॉर्म्सवरील मजकूर वापरून real time मध्ये web content retrieve करणाऱ्या system-वर poisoning चा धोका किती मोठा आहे, हाच त्याचा मुख्य इशारा आहे. हेच प्लॅटफॉर्म प्रशिक्षण किंवा citation source म्हणूनही काम करतात.

आता हे का महत्त्वाचे आहे

ही चिंता केवळ सैद्धांतिक नाही. AI search आणि deep-research products increasingly retrieval आणि generation यांचे संयोजन करतात, वेबवरून ताजी माहिती घेतात आणि त्यांच्या उत्तरांमध्ये स्रोत cite करतात. ही रचना अचूकता आणि traceability वाढवण्यासाठी आहे. पण त्यामुळे एक नवीन attack surface तयार होते: जर source material strategic पद्धतीने ठेवता किंवा बदलता आला, तर तयार होणारे उत्तरही तसाच वळवता येते.

नोंदवलेल्या निष्कर्षांमधून ही असुरक्षा किती गंभीर असू शकते, याचा अंदाज येतो. 404 Media च्या preprint अहवालानुसार, deep-research agents सुमारे निम्म्या queries मध्ये user-generated sites ला cite करतात, आणि सर्व citations पैकी जवळपास चतुर्थांश user-generated websites कडून येतात. याचा अर्थ forums आणि collectively edited संसाधने दुय्यम स्रोत नाहीत. ती मध्यवर्ती inputs आहेत.

जर एक poisoned Reddit comment संबंधित queries च्या संपूर्ण गटासाठी generated outputs वर परिणाम करू शकत असेल, असे पेपरमध्ये कथितपणे म्हटले आहे, तर समस्या isolated prompt tricks पेक्षा खूप पुढे जाते. हे माहिती प्रणाल्या वळवण्याचे scalable साधन बनते, ज्या अनेक वापरकर्त्यांना neutral किंवा synthesized वाटू शकतात.

Most Americans Say Climate Change Is Making Life More Expensive. They're Right

अमेरिकन लोक वाढत्या जीवनखर्चाशी हवामान बदलाला अधिकाधिक जोडत आहेत

नव्या सर्वेक्षणातून दिसते की बहुतेक नोंदणीकृत अमेरिकी मतदारांना वाटते की हवामान बदल खर्च वाढवत आहे, आणि हा दृष्टिकोन ऊर्जा, अन्न, विमा, आणि आपत्ती खर्चांवरील संशोधनाशी जुळतो.

Read article

Search manipulation मधील नवीन आघाडी

हा अहवाल या संशोधनाला AEO, म्हणजेच AI-engine optimization म्हणून ओळखल्या जाणाऱ्या वाढत्या उद्योगाशी जोडतो. हा शब्द brands किंवा इतर actors AI systems जिथे सामग्री शोधण्याची आणि cite करण्याची शक्यता जास्त असते तिथे promotional content ठेवण्याच्या प्रयत्नांना सूचित करतो. जुन्या search युगात स्पर्धा search engines मध्ये pages ranking वर केंद्रित होती. retrieval-augmented AI युगात, उत्तर तयार करताना AI systems जी documents वाचतात त्यांना आकार देणेही स्पर्धेचा भाग बनते.

त्यामुळे सार्वजनिक समुदायांसाठीचे प्रोत्साहन बदलते. Reddit thread, Wikipedia entry, किंवा Quora answer आता फक्त मानवी वाचकांसाठीची post राहत नाही. ती machine-generated guidance, product recommendations, किंवा factual summaries साठी raw materialही ठरू शकते. परिणामी, अशा जागांमध्ये रणनीतीने मांडलेली सामग्री टाकण्याची प्रेरणा वाढते.

It Is Trivially Easy to Use Reddit to Manipulate AI Search, Research Suggests — Image: Reddit

या गतिशीलतेशी जोडलेला promotional material चा पूर moderators आणि editors यांनी आधीच लक्षात घेतल्याचे अहवालात म्हटले आहे. Cornell research हा प्रयत्न का यशस्वी होऊ शकतो याचे तांत्रिक स्पष्टीकरण देत असल्याचे दिसते: models वर परिणाम करण्यासाठी मोठ्या, गुंतागुंतीच्या मोहिमेची गरज नसते. अगदी लहान भरही पुरेशी ठरू शकते.

Moderation चा भार वाढतो

या पेपरचा एक सर्वात महत्त्वाचा परिणाम केवळ तांत्रिक नसून संस्थात्मक आहे. वापरकर्त्यांनी तयार केलेल्या समुदायांचे व्यवस्थापन बहुधा volunteer moderators किंवा editors करतात. जर ते समुदाय AI systems साठी upstream infrastructure बनले, तर आवश्यक साधने, संसाधने किंवा अधिकार न मिळताही त्यांच्यावर एक नवीन संरक्षणात्मक जबाबदारी येते.

अहवालात वर्णन केलेल्या “cat-and-mouse” खेळात हा भार विशेष स्पष्ट होतो. लोक आपल्या समुदायांमधून low-quality किंवा manipulative content दूर ठेवण्याचा प्रयत्न करतात, तर brands किंवा operators त्याच समुदायांचा AI visibility साठी उपयोग करण्याचा प्रयत्न करतात. प्रेक्षक मुख्यतः मानव होते तेव्हाही human moderation कठीण होती. खरा target automated retrieval system असेल तर ती आणखी कठीण होते.

ही समस्या cited AI answers ची विश्वासार्हताही गुंतागुंतीची करते. सार्वजनिक स्रोतांचा हवाला देणारे उत्तर purely generated उत्तरापेक्षा अधिक विश्वासार्ह वाटू शकते, पण जर cited material स्वतः poisoned असेल, तर citation तितका सुरक्षितता उपाय राहत नाही.

The UK Announces Social Media Ban for Under-16s That's Even More Restrictive Than Australia

16 वर्षांखालीलांसाठी व्यापक सोशल मीडिया बंदीची UK योजना

ब्रिटनचे म्हणणे आहे की ते 16 वर्षांखालीलांना सोशल मीडियावरून बंदी घालेल आणि ऑस्ट्रेलियाच्या मॉडेलपेक्षा पुढे जाऊन काही live-streaming, chat आणि gaming वैशिष्ट्यांवरही मर्यादा आणेल.

Read article

हा अभ्यास काय बदलतो

दिलेल्या सारांशाच्या आधारे Cornell च्या कामाचा सर्वात मोठा फायदा म्हणजे तो एक व्यापकपणे संशयित समस्या अधिक औपचारिक करतो. निरीक्षकांनी संशयास्पद promotional patterns आणि AI outputs गेम करण्याचे प्रयत्न पाहिले आहेत. हा अभ्यास फक्त हेच दर्शवत नाही की असे वर्तन अस्तित्वात आहे, तर तांत्रिक मार्ग असामान्यपणे स्वस्त आणि प्रभावी आहे, हेही दाखवतो.

हे AI companies, platform operators, regulators, आणि users या सगळ्यांसाठी महत्त्वाचे आहे. AI कंपन्यांना अधिक मजबूत retrieval filters, source-weighting systems, किंवा poisoned public content विरुद्ध adversarial testing लागेल. Community platforms वर coordinated manipulation ओळखण्यासाठी दबाव वाढू शकतो. दरम्यान, वापरकर्त्यांना polished AI answers कडेही commercial gain साठी optimize केलेल्या search results सारख्याच संशयाने पाहावे लागू शकते.

मोठा धडा अस्वस्थ करणारा, पण स्पष्ट आहे. AI systems ऑनलाइन माहितीचे प्रमुख interface बनत असताना, सार्वजनिक ज्ञान घडवण्याची लढाई संपत नाही. ती फक्त upstream मध्ये, त्या systems ज्या comments, posts, आणि snippets वर अवलंबून असतात त्यामध्ये सरकते. जर 13 शब्द एक उत्तर हलवू शकत असतील, तर AI search भोवतीचे information ecosystem दिसते त्यापेक्षा अधिक नाजूक आहे.

हा लेख 404 Media च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.

Originally published on 404media.co

Reddit मधील लहान तुकडे AI उत्तरांवर परिणाम करू शकतात, असा अभ्यास सांगतो