Meta AI प्रशिक्षण के लिए कर्मचारी कीस्ट्रोक्स और क्लिक का उपयोग करेगा

Meta AI प्रशिक्षण डेटा के नए स्रोत के लिए अंदरूनी दुनिया की ओर देख रहा है

Meta कहता है कि वह कुछ ऐप्लिकेशनों पर अपने कर्मचारियों से माउस मूवमेंट, बटन क्लिक और अन्य यूज़र इनपुट एकत्र करेगा, ताकि कृत्रिम बुद्धिमत्ता मॉडल प्रशिक्षित किए जा सकें। कंपनी की व्याख्या परिचालनात्मक है: यदि वह ऐसे एजेंट बनाना चाहती है जो लोगों को कंप्यूटर पर रोज़मर्रा के काम पूरे करने में मदद करें, तो मॉडलों को ऐसे उदाहरण चाहिए जो दिखाएँ कि मनुष्य वास्तव में इंटरफ़ेस का उपयोग कैसे करते हैं, मेनू में कैसे नेविगेट करते हैं, और सॉफ़्टवेयर परिवेशों में क्रियाएँ कैसे करते हैं।

सतह पर यह तर्क समझना आसान है। जिस प्रणाली को कंप्यूटर पर कार्रवाई करनी है, उसे व्यवहार के ऐसे निशान चाहिए जो सिर्फ़ यह न दिखाएँ कि कार्य क्या है, बल्कि यह भी दिखाएँ कि कोई व्यक्ति उसे कैसे पूरा करता है। फिर भी यह कदम इसलिए उल्लेखनीय है क्योंकि यह AI उद्योग में एक व्यापक बदलाव को रेखांकित करता है। प्रशिक्षण डेटा अब केवल सार्वजनिक पाठ, लाइसेंस प्राप्त मीडिया, या पारंपरिक लेबल वाले डेटासेट तक सीमित नहीं है। लगातार, मॉडल विकास के लिए कच्चे माल में मानव श्रम के रिकॉर्ड भी शामिल हो रहे हैं।

Meta क्या इकट्ठा करने की बात कह रहा है

स्रोत पाठ के अनुसार, Meta ने एक बयान दिया है जिसमें कहा गया है कि वह एक आंतरिक उपकरण शुरू कर रहा है जो कुछ ऐप्लिकेशनों पर “इन तरह के इनपुट” को कैप्चर करेगा। कंपनी ने इसका उद्देश्य ऐसे एजेंटों के लिए मॉडलों को प्रशिक्षित करना बताया जो लोगों को रोज़मर्रा के कंप्यूटर-आधारित कार्य पूरे करने में मदद कर सकें। Meta ने यह भी कहा कि संवेदनशील सामग्री की सुरक्षा के लिए सुरक्षा उपाय मौजूद हैं और डेटा का किसी अन्य उद्देश्य के लिए उपयोग नहीं किया जाता।

यह शब्दावली महत्वपूर्ण है। बयान व्यापक निगरानी के बजाय इंटरैक्शन डेटा पर केंद्रित है, लेकिन यह अभी भी एक ऐसी प्रणाली का वर्णन करता है जो नियमित कार्यस्थल व्यवहार को प्रशिक्षण सामग्री में बदलती है। क्लिक, कर्सर मूवमेंट और नेविगेशन पैटर्न अलग-अलग देखने पर मामूली लग सकते हैं, लेकिन साथ मिलकर वे यह समृद्ध नक्शा बनाते हैं कि डिजिटल प्रणालियों पर काम कैसे किया जाता है।

इस तरह का डेटा मूल्यवान हो सकता है क्योंकि यह कंप्यूटिंग की प्रक्रियात्मक परत को पकड़ता है। बड़े भाषा मॉडल सॉफ़्टवेयर कार्यों के बारे में पाठ बना सकते हैं। लेकिन जो चीज़ अक्सर उनके पास नहीं होती, वह वास्तविक इंटरफ़ेस में मनुष्यों द्वारा अपनाए जाने वाले चरण-दर-चरण पैटर्न का ठोस व्यवहारिक प्रमाण है। आंतरिक कर्मचारी उपयोग ठीक यही प्रदान करता है।

Two drones, one yellow, one grey, almost identical otherwise.

FCC कथित DJI फ्रंट कंपनियों पर रेट्रोएक्टिव प्रतिबंध की ओर बढ़ रहा है

अमेरिकी संचार नियामक उन कंपनियों के खिलाफ एक नए प्रवर्तन उपकरण का उपयोग करने की तैयारी कर रहा है, जिनके बारे में उसका कहना है कि उन्होंने DJI उत्पादों को अमेरिकी बाजार में बनाए रखने के लिए उन्हें छिपाया था.

Read article

AI उद्योग नए इनपुट क्यों खोज रहा है

रिपोर्ट Meta के फ़ैसले को प्रशिक्षण डेटा के लिए व्यापक दौड़ के संदर्भ में रखती है। जैसे-जैसे AI सिस्टम अधिक सक्षम होते जा रहे हैं, कंपनियाँ ऐसे स्रोत खोज रही हैं जो अधिक कार्य-विशिष्ट, अधिक वर्तमान, और वास्तविक दुनिया के व्यवहार से अधिक निकटता से जुड़े हों। डिजिटल एजेंट के रूप में काम करने वाले सिस्टमों के लिए केवल पाठ पर्याप्त नहीं है। डेवलपर्स को ग्राफ़िकल इंटरफ़ेस, फ़ॉर्म, बटन, ड्रॉपडाउन और कई ऐप्लिकेशनों में फैले वर्कफ़्लोज़ के साथ इंटरैक्शन के रिकॉर्ड चाहिए।

यही कारण समझाता है कि आंतरिक कॉर्पोरेट गतिविधि आकर्षक क्यों बन रही है। कंपनियों के भीतर पहले से ही संचालनात्मक व्यवहार की बड़ी मात्रा मौजूद होती है: मीटिंग नोट्स, सपोर्ट लॉग, प्रोजेक्ट इतिहास, सॉफ़्टवेयर उपयोग पैटर्न, और संचार संग्रह। स्रोत पाठ एक और हालिया उदाहरण की ओर संकेत करता है, जिसमें पुराने स्टार्टअप्स से कथित तौर पर Slack आर्काइव्स और Jira टिकट जैसे आंतरिक संचार निकाले जा रहे थे, जिन्हें AI ईंधन के रूप में फिर से इस्तेमाल किया जा सकता था। पैटर्न स्पष्ट है। सहयोग के लिए कभी बनाए गए सूचना-टुकड़े अब अधिकाधिक मॉडल इनपुट के रूप में पुनर्मूल्यांकित किए जा रहे हैं।

Meta का तरीका इसलिए अलग है क्योंकि वह सिर्फ़ ऐतिहासिक रिकॉर्ड नहीं निकाल रहा। वह एक विशिष्ट उत्पाद महत्वाकांक्षा के समर्थन में कर्मचारियों से लाइव इंटरैक्शन डेटा कैप्चर कर रहा है।

रणनीतिक लक्ष्य: बेहतर कंप्यूटर-उपयोगी एजेंट

Meta का बयान सीधे उस उत्पाद श्रेणी की ओर इशारा करता है जो दाँव पर है: ऐसे AI एजेंट जो उपयोगकर्ताओं को कंप्यूटर पर रोज़मर्रा के कार्य पूरे करने में मदद कर सकें। यह उद्योग का एक महत्वपूर्ण मोर्चा है। एक चैटबॉट जो किसी वर्कफ़्लो को समझा सकता है और एक एजेंट जो उसे निष्पादित कर सकता है, उनके बीच का अंतर बहुत बड़ा है। उस अंतर को पार करने के लिए कंपनियों को ऐसे मॉडल चाहिए जो केवल भाषा ही नहीं, इंटरफ़ेस व्यवहार भी समझें।

माउस मूवमेंट और क्लिक पर प्रशिक्षण मॉडलों को सामान्य क्रिया-क्रम, संभावित इंटरफ़ेस अफ़ोर्डेंस और वे निर्णय-बिंदु सीखने में मदद कर सकता है जिनका सामना लोग ऐप्लिकेशनों पर काम करते समय करते हैं। दूसरे शब्दों में, कंपनी उस व्यवहारिक आधार को इकट्ठा कर रही प्रतीत होती है जो ऐसी स्वचालन प्रणालियों के लिए चाहिए जो कम अमूर्त और अधिक परिचालनात्मक हों।

यही कारण है कि यह कदम केवल एक आंतरिक टूलिंग अपडेट से बड़ा है। यह इस बात का प्रमाण है कि कंपनियाँ AI सिस्टम की अगली पीढ़ी को किस तरह प्रतिस्पर्धा करते देख रही हैं: केवल बातचीत की गुणवत्ता पर नहीं, बल्कि सॉफ़्टवेयर परिवेशों के भीतर काम करने की उनकी क्षमता पर।

$A fractured image of a person speaking into a microphone.$

Sony ने 30,000 गानों पर नए मुकदमे के साथ Udio के खिलाफ लड़ाई को और बढ़ाया

Sony Music ने Udio पर 30,000 से अधिक गानों के उल्लंघन का आरोप लगाते हुए एक नया मुकदमा दायर किया है, जिससे जेनेरेटिव AI संगीत को लेकर सबसे महत्वपूर्ण कॉपीराइट लड़ाइयों में से एक और तेज हो गई है।

Read article

गोपनीयता और शासन की समस्या

उसी तर्क से जो इस डेटा को उपयोगी बनाता है, वह इसे संवेदनशील भी बनाता है। कार्यस्थल की इंटरैक्शन तटस्थ अवशेष नहीं होतीं। वे आदतों, प्राथमिकताओं, गलतियों, पहुँच-पैटर्न और कुछ मामलों में संवेदनशील जानकारी की झलक भी उजागर कर सकती हैं। भले ही Meta संग्रह को कुछ ऐप्लिकेशनों तक सीमित रखे और कहे कि सुरक्षा उपाय मौजूद हैं, यह निर्णय एक शासन प्रश्न उठाता है जो केवल एक कंपनी तक सीमित नहीं रहेगा: सामान्य कर्मचारी गतिविधि का कितना हिस्सा मॉडल प्रशिक्षण के लिए पुनः इस्तेमाल किया जा सकता है, इससे पहले कि कार्यस्थल निगरानी और उत्पाद विकास को अलग करना मुश्किल हो जाए?

मुद्दा सिर्फ़ यह नहीं है कि निजी सामग्री उजागर होती है या नहीं। यह सहमति, दायरा और उदाहरण-स्थापना के बारे में भी है। एक बार जब एंटरप्राइज़ सिस्टमों के भीतर यूज़र व्यवहार को प्रशिक्षण सामग्री माना जाने लगे, तो संगठनों पर यह नियम औपचारिक करने का दबाव पड़ सकता है कि किस प्रकार के कार्य-ट्रेस कैप्चर किए जा सकते हैं, उन्हें कितने समय तक रखा जा सकता है, और क्या कर्मचारियों को भागीदारी पर वास्तविक राय देने का अधिकार है। स्रोत पाठ इन सवालों के जवाब नहीं देता, लेकिन यह स्पष्ट कर देता है कि वे क्यों तात्कालिक बन रहे हैं।

यह AI विकास की दिशा का संकेत है

Meta का आंतरिक डेटा-संग्रह उपकरण वर्तमान AI प्रतिस्पर्धा के एक बड़े सत्य को उजागर करता है। उद्योग उस युग से आगे बढ़ रहा है जहाँ मॉडल प्रगति मुख्यतः इंटरनेट-स्तर के अधिक पाठ इकट्ठा करने पर निर्भर थी। अगली बढ़त संभवतः ऐसे डेटा से आएगी जो अधिक संकीर्ण, अधिक व्यवहारिक, और विशिष्ट कार्यों से अधिक निकटता से जुड़ा होगा। इससे तकनीकी प्लेबुक और डेटा उपयोग के आसपास का सामाजिक अनुबंध, दोनों बदलते हैं।

Meta के लिए निकट-अवधि का लाभ उन सिस्टमों के लिए बेहतर प्रशिक्षण हो सकता है जो कंप्यूटरों को अधिक प्रभावी ढंग से संचालित करते हैं। व्यापक बाज़ार के लिए, यह घोषणा इस बात का एक और संकेत है कि रोज़मर्रा के डिजिटल व्यवहार को AI के लिए रणनीतिक इंफ़्रास्ट्रक्चर के रूप में फिर से परिभाषित किया जा रहा है।

अंततः यही सबसे महत्वपूर्ण निष्कर्ष हो सकता है। AI प्रशिक्षण का भविष्य केवल इस पर नहीं बनेगा कि लोग ऑनलाइन क्या कहते या लिखते हैं। यह इस पर भी बनेगा कि वे सॉफ़्टवेयर में कैसे आगे बढ़ते हैं, स्क्रीन पर कैसे निर्णय लेते हैं, और डिजिटल काम की दिनचर्या कैसे पूरी करते हैं। Meta ने इस बदलाव को असामान्य रूप से स्पष्ट कर दिया है। अब उद्योग का बाकी हिस्सा तकनीकी लाभ और शासन जोखिम, दोनों के लिए ध्यान से देखेगा।

यह लेख TechCrunch की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on techcrunch.com

Meta की कर्मचारियों के क्लिक और कीस्ट्रोक्स पकड़ने की योजना दिखाती है कि AI डेटा की तलाश कितनी फैल गई है