AI प्रशिक्षण डेटाच्या नव्या स्रोतासाठी Meta आत वळत आहे

Meta म्हणते की ती आपल्या कर्मचाऱ्यांकडून काही अनुप्रयोगांवरील माउस हालचाली, बटण क्लिक आणि इतर वापरकर्ता इनपुट गोळा करणार आहे, हे कृत्रिम बुद्धिमत्ता मॉडेल्सना प्रशिक्षण देण्याच्या प्रयत्नाचा भाग आहे. कंपनीचे स्पष्टीकरण कार्यात्मक आहे: जर तिला अशा एजंट्स तयार करायचे असतील जे लोकांना संगणकांवर दैनंदिन कामे पूर्ण करण्यात मदत करतील, तर मॉडेल्सना मानव प्रत्यक्षात इंटरफेस कसे वापरतात, मेनूंमध्ये कसे नेव्हिगेट करतात आणि सॉफ्टवेअर वातावरणांमध्ये कृती कशा पार पाडतात याची उदाहरणे लागतील.

पृष्ठभागावर पाहता, हे कारण समजायला सोपे आहे. संगणकावर काम करणाऱ्या प्रणालीला केवळ काम काय आहे हे नाही, तर एखादी व्यक्ती ते कसे पूर्ण करते हे दाखवणारे वर्तनात्मक ठसे लागतात. तरीही ही हालचाल लक्षणीय आहे, कारण ती AI उद्योगातील व्यापक बदल अधोरेखित करते. प्रशिक्षण डेटा आता केवळ सार्वजनिक मजकूर, परवानाकृत मीडिया किंवा पारंपरिक लेबल केलेल्या डेटासेटपुरता मर्यादित नाही. वाढत्या प्रमाणात, मॉडेल विकासासाठी कच्चा माल स्वतः मानवी श्रमाच्या नोंदी बनत आहे.

Meta काय गोळा करत आहे

मूळ मजकुरानुसार, Meta ने एका निवेदनात सांगितले की ती एक अंतर्गत साधन सुरू करत आहे, जे काही अनुप्रयोगांवर “या प्रकारचे इनपुट” पकडेल. कंपनीने सांगितले की हेतू म्हणजे अशा एजंट्ससाठी मॉडेल्सना प्रशिक्षण देणे, जे लोकांना दैनंदिन संगणक-आधारित कामे पूर्ण करण्यात मदत करू शकतील. Meta ने असेही सांगितले की संवेदनशील सामग्रीचे संरक्षण करण्यासाठी सुरक्षा उपाय आहेत आणि हा डेटा इतर कोणत्याही उद्देशासाठी वापरला जात नाही.

त्या शब्दरचनेला महत्त्व आहे. निवेदन व्यापक देखरेखीपेक्षा संवाद डेटावर लक्ष केंद्रित करते, पण तरीही ते अशा प्रणालीचे वर्णन करते जी नियमित कार्यस्थळ वर्तनाला प्रशिक्षण साहित्यामध्ये रूपांतरित करते. क्लिक, कर्सर हालचाली आणि नेव्हिगेशन पॅटर्न स्वतंत्रपणे किरकोळ वाटू शकतात, पण एकत्रितपणे ते डिजिटल प्रणालींमध्ये काम कसे होते याचा समृद्ध नकाशा तयार करतात.

असा डेटा मौल्यवान ठरू शकतो, कारण तो संगणकीय प्रक्रियेचा स्तर पकडतो. मोठी भाषा मॉडेल्स आधीच सॉफ्टवेअर कामांविषयी मजकूर तयार करू शकतात. पण प्रत्यक्ष इंटरफेसवर मानव जे चरण-दर-चरण पॅटर्न पाळतात, त्याचे ठोस वर्तनात्मक पुरावे त्यांच्याकडे अनेकदा नसतात. अंतर्गत कर्मचाऱ्यांच्या वापरातून तेच मिळते.

AI उद्योग नवीन इनपुट्स का शोधत आहे

ही अहवाल Meta च्या निर्णयाला प्रशिक्षण डेटाच्या व्यापक शर्यतीच्या संदर्भात मांडते. AI प्रणाली अधिक सक्षम होत असताना, कंपन्या अशा स्त्रोतांचा शोध घेत आहेत जे अधिक कार्यविशिष्ट, अधिक अद्ययावत आणि प्रत्यक्ष जगातील वर्तनाशी अधिक जवळचे असतील. डिजिटल एजंट्स म्हणून काम करायच्या प्रणालींसाठी मजकूर पुरेसा नाही. डेव्हलपर्सना ग्राफिकल इंटरफेस, फॉर्म्स, बटणे, ड्रॉपडाउन आणि अनेक अनुप्रयोगांमधून जाणाऱ्या workflows सोबतच्या संवादांचे रेकॉर्ड्स लागतात.

यामुळेच अंतर्गत कॉर्पोरेट क्रियाकलाप आकर्षक होत आहेत. कंपन्यांकडे आधीच ऑपरेशनल वर्तनाचा मोठा साठा असतो: मीटिंग नोट्स, सपोर्ट लॉग्स, प्रोजेक्ट इतिहास, सॉफ्टवेअर वापराचे पॅटर्न, आणि संवाद संग्रह. मूळ मजकूर आणखी एका अलीकडील उदाहरणाचा उल्लेख करतो, ज्यात जुन्या startups मधील Slack archives आणि Jira tickets सारख्या अंतर्गत संवादांचा कथितपणे शोध घेतला जात होता, जे AI इंधन म्हणून पुनर्वापरले जाऊ शकतात. नमुना स्पष्ट आहे. एकेकाळी सहयोगासाठी तयार केलेली माहिती आता model input म्हणून पुन्हा मूल्यमापन केली जात आहे.

Meta ची पद्धत वेगळी आहे, कारण ती केवळ ऐतिहासिक नोंदी गोळा करत नाही. ती विशिष्ट उत्पादन महत्त्वाकांक्षेला पाठिंबा देण्यासाठी कर्मचाऱ्यांकडून थेट संवाद डेटा गोळा करत आहे.

धोरणात्मक उद्दिष्ट: संगणक वापरणारे अधिक चांगले एजंट्स

Meta चे विधान थेट त्या उत्पादन वर्गाकडे निर्देश करते, ज्यावर दांव आहे: असे AI एजंट्स जे वापरकर्त्यांना संगणकांवर दैनंदिन कामे पूर्ण करण्यात मदत करू शकतील. हा उद्योगातील एक महत्त्वाचा टप्पा आहे. workflow समजावून सांगू शकणारा chatbot आणि तो कार्यान्वित करू शकणारा agent यांच्यातील फरक प्रचंड आहे. तो फरक पार करण्यासाठी कंपन्यांना असे मॉडेल्स लागतात जे केवळ भाषा नव्हे, तर interface वर्तनही समजतात.

माउस हालचाली आणि क्लिकवर प्रशिक्षण दिल्यास मॉडेल्सना सामान्य क्रिया अनुक्रम, संभाव्य interface affordances, आणि अनुप्रयोगांमध्ये काम करताना मानवांना भेडसावणारे निर्णयबिंदू शिकता येऊ शकतात. दुसऱ्या शब्दांत, कंपनी कमी अमूर्त आणि अधिक कार्यवाही-आधारित स्वयंचलनासाठी आवश्यक असलेला वर्तनात्मक पाया गोळा करत असल्याचे दिसते.

म्हणूनच ही हालचाल अंतर्गत साधन अद्यतनापेक्षा मोठी आहे. पुढील पिढीतील AI प्रणाली कशावर स्पर्धा करतील अशी कंपन्यांची अपेक्षा आहे, याचा हा पुरावा आहे: केवळ संभाषणाच्या गुणवत्तेवर नाही, तर सॉफ्टवेअर वातावरणात कृती करण्याच्या क्षमतेवरही.

गोपनीयता आणि प्रशासनाची समस्या

हा डेटा उपयुक्त बनवणारीच तर्कशृंखला त्याला संवेदनशीलही बनवते. कार्यस्थळातील संवाद तटस्थ अवशेष नसतात. ते सवयी, प्राधान्ये, चुका, प्रवेशाचे नमुने, आणि काही वेळा संवेदनशील माहितीची झलक उघड करू शकतात. जरी Meta ने संकलन काही अनुप्रयोगांपुरते मर्यादित ठेवले आणि सुरक्षा उपाय असल्याचे सांगितले, तरीही हा निर्णय एक प्रशासनात्मक प्रश्न उभा करतो, जो एका कंपनीपुरता मर्यादित राहणार नाही: सामान्य कर्मचाऱ्यांच्या क्रियाकलापांपैकी किती भाग model training साठी पुनर्वापरता येईल, त्याआधी workplace monitoring आणि product development यांच्यात फरक करणे कठीण होईल?

मुद्दा फक्त खाजगी सामग्री उघड होते की नाही, एवढाच नाही. तो संमती, व्याप्ती, आणि उदाहरणाचा विषयही आहे. एकदा enterprise systems मधील user behavior ला प्रशिक्षण साहित्य मानले जाऊ लागले, की संस्था कोणत्या प्रकारचे work traces पकडता येतील, ते किती काळ साठवता येतील, आणि कर्मचाऱ्यांना सहभागाबद्दल अर्थपूर्ण मत आहे का, याबाबत नियम औपचारिक करण्याच्या दबावाखाली येऊ शकतात. मूळ मजकूर त्या प्रश्नांची उत्तरे देत नाही, पण ती का तातडीची होत आहेत हे स्पष्ट करतो.

AI विकास कुठे चालला आहे याचे चिन्ह

Meta चे अंतर्गत डेटा-संकलन साधन सध्याच्या AI शर्यतीबद्दल एक मोठे सत्य दाखवते. उद्योग त्या युगापलीकडे जात आहे, जिथे मॉडेल प्रगती मुख्यतः अधिक इंटरनेट-स्तरीय मजकूर साठवण्यावर अवलंबून होती. पुढील प्रगती अधिक अरुंद, अधिक वर्तनाधारित, आणि विशिष्ट कामांशी अधिक घट्ट जोडलेल्या डेटातून येण्याची शक्यता आहे. यामुळे तांत्रिक आराखडा आणि डेटा वापराबद्दलचा सामाजिक करार दोन्ही बदलतात.

Meta साठी, निकटकालीन फायदा म्हणजे संगणक अधिक प्रभावीपणे चालवणाऱ्या प्रणालींसाठी सुधारित प्रशिक्षण असू शकते. व्यापक बाजारासाठी, ही घोषणा आणखी एक चिन्ह आहे की दैनंदिन डिजिटल वर्तनाला AI साठी धोरणात्मक पायाभूत सुविधा म्हणून पुन्हा मांडले जात आहे.

अखेरीस, तीच कदाचित सर्वात महत्त्वाची निष्कर्ष ठरेल. AI प्रशिक्षणाचे भविष्य केवळ लोक ऑनलाइन काय म्हणतात किंवा लिहितात यावर ठरणार नाही. ते ते सॉफ्टवेअरमधून कसे पुढे जातात, स्क्रीनवर निर्णय कसे घेतात, आणि डिजिटल कामाच्या रोजच्या दिनक्रमांची पूर्तता कशी करतात यावरही ठरेल. Meta ने हा बदल असामान्यपणे स्पष्ट केला आहे. उर्वरित उद्योग, त्यातून मिळणारे तांत्रिक फायदे आणि उघड होणारे प्रशासनिक धोके, दोन्ही काळजीपूर्वक पाहण्याची शक्यता आहे.

हा लेख TechCrunch च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.

Originally published on techcrunch.com