Meta कर्मचारी कीस्ट्रोक्स आणि क्लिक AI प्रशिक्षणासाठी वापरणार

AI प्रशिक्षण डेटाच्या नव्या स्रोतासाठी Meta आत वळत आहे

Meta म्हणते की ती आपल्या कर्मचाऱ्यांकडून काही अनुप्रयोगांवरील माउस हालचाली, बटण क्लिक आणि इतर वापरकर्ता इनपुट गोळा करणार आहे, हे कृत्रिम बुद्धिमत्ता मॉडेल्सना प्रशिक्षण देण्याच्या प्रयत्नाचा भाग आहे. कंपनीचे स्पष्टीकरण कार्यात्मक आहे: जर तिला अशा एजंट्स तयार करायचे असतील जे लोकांना संगणकांवर दैनंदिन कामे पूर्ण करण्यात मदत करतील, तर मॉडेल्सना मानव प्रत्यक्षात इंटरफेस कसे वापरतात, मेनूंमध्ये कसे नेव्हिगेट करतात आणि सॉफ्टवेअर वातावरणांमध्ये कृती कशा पार पाडतात याची उदाहरणे लागतील.

पृष्ठभागावर पाहता, हे कारण समजायला सोपे आहे. संगणकावर काम करणाऱ्या प्रणालीला केवळ काम काय आहे हे नाही, तर एखादी व्यक्ती ते कसे पूर्ण करते हे दाखवणारे वर्तनात्मक ठसे लागतात. तरीही ही हालचाल लक्षणीय आहे, कारण ती AI उद्योगातील व्यापक बदल अधोरेखित करते. प्रशिक्षण डेटा आता केवळ सार्वजनिक मजकूर, परवानाकृत मीडिया किंवा पारंपरिक लेबल केलेल्या डेटासेटपुरता मर्यादित नाही. वाढत्या प्रमाणात, मॉडेल विकासासाठी कच्चा माल स्वतः मानवी श्रमाच्या नोंदी बनत आहे.

Meta काय गोळा करत आहे

मूळ मजकुरानुसार, Meta ने एका निवेदनात सांगितले की ती एक अंतर्गत साधन सुरू करत आहे, जे काही अनुप्रयोगांवर “या प्रकारचे इनपुट” पकडेल. कंपनीने सांगितले की हेतू म्हणजे अशा एजंट्ससाठी मॉडेल्सना प्रशिक्षण देणे, जे लोकांना दैनंदिन संगणक-आधारित कामे पूर्ण करण्यात मदत करू शकतील. Meta ने असेही सांगितले की संवेदनशील सामग्रीचे संरक्षण करण्यासाठी सुरक्षा उपाय आहेत आणि हा डेटा इतर कोणत्याही उद्देशासाठी वापरला जात नाही.

त्या शब्दरचनेला महत्त्व आहे. निवेदन व्यापक देखरेखीपेक्षा संवाद डेटावर लक्ष केंद्रित करते, पण तरीही ते अशा प्रणालीचे वर्णन करते जी नियमित कार्यस्थळ वर्तनाला प्रशिक्षण साहित्यामध्ये रूपांतरित करते. क्लिक, कर्सर हालचाली आणि नेव्हिगेशन पॅटर्न स्वतंत्रपणे किरकोळ वाटू शकतात, पण एकत्रितपणे ते डिजिटल प्रणालींमध्ये काम कसे होते याचा समृद्ध नकाशा तयार करतात.

असा डेटा मौल्यवान ठरू शकतो, कारण तो संगणकीय प्रक्रियेचा स्तर पकडतो. मोठी भाषा मॉडेल्स आधीच सॉफ्टवेअर कामांविषयी मजकूर तयार करू शकतात. पण प्रत्यक्ष इंटरफेसवर मानव जे चरण-दर-चरण पॅटर्न पाळतात, त्याचे ठोस वर्तनात्मक पुरावे त्यांच्याकडे अनेकदा नसतात. अंतर्गत कर्मचाऱ्यांच्या वापरातून तेच मिळते.

Two drones, one yellow, one grey, almost identical otherwise.

संशयित DJI फ्रंट कंपन्यांवर मागील तारखेपासून बंदी घालण्याकडे FCC

DJI उत्पादने अमेरिकन बाजारात ठेवण्यासाठी त्यांना लपवले, असे ज्या कंपन्यांबद्दल ते म्हणते, त्यांच्याविरुद्ध नवीन अंमलबजावणी साधन वापरण्याची अमेरिकेची संचार नियामक संस्था तयारी करत आहे.

Read article

AI उद्योग नवीन इनपुट्स का शोधत आहे

ही अहवाल Meta च्या निर्णयाला प्रशिक्षण डेटाच्या व्यापक शर्यतीच्या संदर्भात मांडते. AI प्रणाली अधिक सक्षम होत असताना, कंपन्या अशा स्त्रोतांचा शोध घेत आहेत जे अधिक कार्यविशिष्ट, अधिक अद्ययावत आणि प्रत्यक्ष जगातील वर्तनाशी अधिक जवळचे असतील. डिजिटल एजंट्स म्हणून काम करायच्या प्रणालींसाठी मजकूर पुरेसा नाही. डेव्हलपर्सना ग्राफिकल इंटरफेस, फॉर्म्स, बटणे, ड्रॉपडाउन आणि अनेक अनुप्रयोगांमधून जाणाऱ्या workflows सोबतच्या संवादांचे रेकॉर्ड्स लागतात.

यामुळेच अंतर्गत कॉर्पोरेट क्रियाकलाप आकर्षक होत आहेत. कंपन्यांकडे आधीच ऑपरेशनल वर्तनाचा मोठा साठा असतो: मीटिंग नोट्स, सपोर्ट लॉग्स, प्रोजेक्ट इतिहास, सॉफ्टवेअर वापराचे पॅटर्न, आणि संवाद संग्रह. मूळ मजकूर आणखी एका अलीकडील उदाहरणाचा उल्लेख करतो, ज्यात जुन्या startups मधील Slack archives आणि Jira tickets सारख्या अंतर्गत संवादांचा कथितपणे शोध घेतला जात होता, जे AI इंधन म्हणून पुनर्वापरले जाऊ शकतात. नमुना स्पष्ट आहे. एकेकाळी सहयोगासाठी तयार केलेली माहिती आता model input म्हणून पुन्हा मूल्यमापन केली जात आहे.

Meta ची पद्धत वेगळी आहे, कारण ती केवळ ऐतिहासिक नोंदी गोळा करत नाही. ती विशिष्ट उत्पादन महत्त्वाकांक्षेला पाठिंबा देण्यासाठी कर्मचाऱ्यांकडून थेट संवाद डेटा गोळा करत आहे.

धोरणात्मक उद्दिष्ट: संगणक वापरणारे अधिक चांगले एजंट्स

Meta चे विधान थेट त्या उत्पादन वर्गाकडे निर्देश करते, ज्यावर दांव आहे: असे AI एजंट्स जे वापरकर्त्यांना संगणकांवर दैनंदिन कामे पूर्ण करण्यात मदत करू शकतील. हा उद्योगातील एक महत्त्वाचा टप्पा आहे. workflow समजावून सांगू शकणारा chatbot आणि तो कार्यान्वित करू शकणारा agent यांच्यातील फरक प्रचंड आहे. तो फरक पार करण्यासाठी कंपन्यांना असे मॉडेल्स लागतात जे केवळ भाषा नव्हे, तर interface वर्तनही समजतात.

माउस हालचाली आणि क्लिकवर प्रशिक्षण दिल्यास मॉडेल्सना सामान्य क्रिया अनुक्रम, संभाव्य interface affordances, आणि अनुप्रयोगांमध्ये काम करताना मानवांना भेडसावणारे निर्णयबिंदू शिकता येऊ शकतात. दुसऱ्या शब्दांत, कंपनी कमी अमूर्त आणि अधिक कार्यवाही-आधारित स्वयंचलनासाठी आवश्यक असलेला वर्तनात्मक पाया गोळा करत असल्याचे दिसते.

म्हणूनच ही हालचाल अंतर्गत साधन अद्यतनापेक्षा मोठी आहे. पुढील पिढीतील AI प्रणाली कशावर स्पर्धा करतील अशी कंपन्यांची अपेक्षा आहे, याचा हा पुरावा आहे: केवळ संभाषणाच्या गुणवत्तेवर नाही, तर सॉफ्टवेअर वातावरणात कृती करण्याच्या क्षमतेवरही.

$A fractured image of a person speaking into a microphone.$

30,000 गाण्यांवरील नव्या खटल्यामुळे Sony ने Udioविरुद्धची लढाई तीव्र केली

30,000 हून अधिक गाण्यांचे उल्लंघन केल्याचा आरोप करत Sony Music ने Udioविरुद्ध नवीन खटला दाखल केला आहे, ज्यामुळे जनरेटिव्ह AI संगीताभोवती सुरू असलेल्या सर्वात महत्त्वाच्या कॉपीराइट संघर्षांपैकी एक अधिक तीव्र झाला आहे.

Read article

गोपनीयता आणि प्रशासनाची समस्या

हा डेटा उपयुक्त बनवणारीच तर्कशृंखला त्याला संवेदनशीलही बनवते. कार्यस्थळातील संवाद तटस्थ अवशेष नसतात. ते सवयी, प्राधान्ये, चुका, प्रवेशाचे नमुने, आणि काही वेळा संवेदनशील माहितीची झलक उघड करू शकतात. जरी Meta ने संकलन काही अनुप्रयोगांपुरते मर्यादित ठेवले आणि सुरक्षा उपाय असल्याचे सांगितले, तरीही हा निर्णय एक प्रशासनात्मक प्रश्न उभा करतो, जो एका कंपनीपुरता मर्यादित राहणार नाही: सामान्य कर्मचाऱ्यांच्या क्रियाकलापांपैकी किती भाग model training साठी पुनर्वापरता येईल, त्याआधी workplace monitoring आणि product development यांच्यात फरक करणे कठीण होईल?

मुद्दा फक्त खाजगी सामग्री उघड होते की नाही, एवढाच नाही. तो संमती, व्याप्ती, आणि उदाहरणाचा विषयही आहे. एकदा enterprise systems मधील user behavior ला प्रशिक्षण साहित्य मानले जाऊ लागले, की संस्था कोणत्या प्रकारचे work traces पकडता येतील, ते किती काळ साठवता येतील, आणि कर्मचाऱ्यांना सहभागाबद्दल अर्थपूर्ण मत आहे का, याबाबत नियम औपचारिक करण्याच्या दबावाखाली येऊ शकतात. मूळ मजकूर त्या प्रश्नांची उत्तरे देत नाही, पण ती का तातडीची होत आहेत हे स्पष्ट करतो.

AI विकास कुठे चालला आहे याचे चिन्ह

Meta चे अंतर्गत डेटा-संकलन साधन सध्याच्या AI शर्यतीबद्दल एक मोठे सत्य दाखवते. उद्योग त्या युगापलीकडे जात आहे, जिथे मॉडेल प्रगती मुख्यतः अधिक इंटरनेट-स्तरीय मजकूर साठवण्यावर अवलंबून होती. पुढील प्रगती अधिक अरुंद, अधिक वर्तनाधारित, आणि विशिष्ट कामांशी अधिक घट्ट जोडलेल्या डेटातून येण्याची शक्यता आहे. यामुळे तांत्रिक आराखडा आणि डेटा वापराबद्दलचा सामाजिक करार दोन्ही बदलतात.

Meta साठी, निकटकालीन फायदा म्हणजे संगणक अधिक प्रभावीपणे चालवणाऱ्या प्रणालींसाठी सुधारित प्रशिक्षण असू शकते. व्यापक बाजारासाठी, ही घोषणा आणखी एक चिन्ह आहे की दैनंदिन डिजिटल वर्तनाला AI साठी धोरणात्मक पायाभूत सुविधा म्हणून पुन्हा मांडले जात आहे.

अखेरीस, तीच कदाचित सर्वात महत्त्वाची निष्कर्ष ठरेल. AI प्रशिक्षणाचे भविष्य केवळ लोक ऑनलाइन काय म्हणतात किंवा लिहितात यावर ठरणार नाही. ते ते सॉफ्टवेअरमधून कसे पुढे जातात, स्क्रीनवर निर्णय कसे घेतात, आणि डिजिटल कामाच्या रोजच्या दिनक्रमांची पूर्तता कशी करतात यावरही ठरेल. Meta ने हा बदल असामान्यपणे स्पष्ट केला आहे. उर्वरित उद्योग, त्यातून मिळणारे तांत्रिक फायदे आणि उघड होणारे प्रशासनिक धोके, दोन्ही काळजीपूर्वक पाहण्याची शक्यता आहे.

हा लेख TechCrunch च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.

Originally published on techcrunch.com

कर्मचाऱ्यांचे क्लिक आणि कीस्ट्रोक्स पकडण्याची Meta ची योजना AI डेटाच्या शोधाचा विस्तार किती झाला आहे हे दाखवते