एक स्टार्टअप रोबोट प्रशिक्षणाचे औद्योगिकीकरण करत आहे

Tutor Intelligence रोबोटिक्सच्या भविष्याबद्दल एक अपवादात्मकपणे थेट मांडणी करत आहे: अडथळा फक्त चांगल्या मॉडेल्सचा नाही, तर प्रत्यक्ष जगात काम करणाऱ्या रोबोट्सकडून गोळा केलेल्या चांगल्या डेटाचा आहे. त्या समस्येला भिडण्यासाठी कंपनीने DF1 नावाची 100 द्विहस्त मॅनिप्युलेटर्सची “Data Factory” उभारली आहे, ज्याला ती भौतिक AI साठी एका प्रकारचे किंडरगार्टन असे म्हणते.

ही कल्पना संकल्पनेत सोपी आहे, पण अंमलबजावणीत महत्त्वाकांक्षी आहे. मुख्यतः सिम्युलेशनवर अवलंबून न राहता, Tutor आपल्या Ti0 vision-language-action मॉडेलला प्रशिक्षण देण्यासाठी प्रत्यक्ष रोबोट्स, मानवी teleoperators, आणि पुनरावृत्ती होणारी कामे वापरत आहे. मोठ्या भाषा मॉडेल्सना मिळणाऱ्या प्रमाणाइतका डेटा रोबोटिक्सकडे नसल्यामुळे, अशी grounded आणि scalable learning pipeline तयार होऊ शकते, असा कंपनीचा दावा आहे.

Tutor च्या पिचचा केंद्रबिंदू हाच आहे. सह-संस्थापक आणि मुख्य कार्यकारी जोश ग्रुएनस्टीन यांच्या मते, रोबोटिक्ससाठी Wikipedia सारखा कुठलाही समकक्ष नाही. इंटरनेटवरील मानवी ज्ञानाने भाषा मॉडेल्सना शिकण्यासाठी विशाल corpus दिला. रोबोट्सना काहीतरी वेगळे हवे आहे: भौतिक प्रात्यक्षिके, सुधारात्मक अभिप्राय, आणि प्रत्यक्ष वस्तू व वातावरणांच्या गोंधळाचा वारंवार अनुभव.

प्रत्यक्ष जगातील डेटा रणनीतिकदृष्ट्या का आकर्षक आहे

Tutor चे DF1 प्रयत्न रोबोटिक्समधील व्यापक चर्चेचे प्रतिबिंब आहेत. सिम्युलेशन अजूनही उपयुक्त आहे, कारण ते स्वस्त, जलद, आणि सुरक्षित आहे. पण सिम्युलेशनमधून वास्तवात वर्तन हस्तांतरित करताना अनेकदा प्रत्यक्ष भौतिक परस्परसंवादाच्या हट्टी गुंतागुंतीला सामोरे जावे लागते. वस्तू विकृत होतात, घसरतात, प्रकाश अनपेक्षितरीत्या परावर्तित करतात, आणि आभासी वातावरण पूर्णपणे पकडू शकत नाही अशा गर्दीत दिसतात.

100 रोबोट्सना एकाच प्रशिक्षण वातावरणात ठेवून आणि e-commerce व kitting मध्ये नेहमीच्या piece-picking कामांवर काम करून Tutor, जिथे प्रत्यक्ष अडचणी निर्माण होतात तिथेच डेटा गोळा करण्याचा प्रयत्न करत आहे. कंपनी म्हणते की रोबोट्स सुरुवातीला अडखळत होते, पण मेक्सिको आणि फिलिपिन्समधील 45 ते 50 दूरस्थ “tutors” ने teleoperation प्रणालीद्वारे काही आठवड्यांत त्यांना सुधारले.

हा सुधारणा पुन्हा मिळवता आली, तर त्याचे परिणाम लक्षणीय आहेत. रोबोटिक्स आधुनिक AI च्या सर्वात खोल फायद्यांपैकी एक उचलू शकते: मोठ्या प्रमाणावर जलद पुनरावृत्ती. इंटरनेट मजकुराद्वारे नाही, तर यंत्रांच्या ताफ्यांमध्ये पसरलेल्या structured human teaching द्वारे.

व्यावसायिक deployment देखील प्रशिक्षण चक्राचा भाग आहे

Tutor DF1 ला प्रयोगशाळेतील कुतूहल म्हणून मांडत नाही. कंपनी या प्रणालीला “virtuous cycle” मधील पहिला टप्पा मानते, ज्यात व्यावसायिकरीत्या deployed रोबोट्स भविष्यातील कामगिरी सुधारण्यासाठी आवश्यक डेटा निर्माण करत राहतील. हा एक महत्त्वाचा रणनीतिक फरक आहे. या मॉडेलमध्ये deployment केवळ तंत्रज्ञानाचे monetization करत नाही. ते त्याला इंधनही पुरवते.

हा चक्र कामी आला, तर तो खूप शक्तिशाली ठरू शकतो. रोबोटने केलेले प्रत्येक प्रत्यक्ष काम edge cases, corrections, examples चा स्रोत बनते, जे पुढे चांगल्या policies मध्ये पुन्हा वापरता येते. कालांतराने, fleets केवळ software updates मुळेच नव्हे, तर औद्योगिक वापरातून जमा झालेल्या वाढत्या operational memory मुळेही सुधारू शकतात.

अर्थात, या दृष्टिकोनासाठी मोठ्या पायाभूत सुविधांची गरज आहे. hardware, teleoperation श्रम, cloud compute, आणि demonstrations ला उपयुक्त training signals मध्ये रूपांतरित करू शकणारा workflow आवश्यक आहे. Tutor या सर्वांमध्ये एकाच वेळी गुंतवणूक करत आहे. कंपनीने डिसेंबर 2025 मध्ये Series A funding मध्ये 34 दशलक्ष डॉलर उभारले आणि Physical AI Fellowship ecosystem चा भाग म्हणून AWS आणि NVIDIA सोबत काम केले आहे.

पुढचा मोठा प्रश्न म्हणजे data factories सर्वसामान्य होतील का

Tutor चा दावा आहे की DF1 ही अमेरिकेतील सर्वात मोठी robotic data factory आहे. हे किती काळ तसे राहते यापेक्षा कल्पना स्वतःच अधिक महत्त्वाची असू शकते. जर general-purpose किंवा semi-general-purpose robotics शेवटी model architecture पेक्षा data quality ने अधिक मर्यादित होत असेल, तर mass robot teaching साठी खास डिझाइन केलेल्या सुविधा उद्योगाचा नेहमीचा भाग बनू शकतात.

असे झाले तर robotics मुख्यतः hardware engineering मधून hardware-संलग्न data operations business कडे वळेल. त्या जगात विजेते ते असू शकतात जे human instruction, fleet deployment, आणि model improvement यांमधील feedback loops सर्वात चांगल्या प्रकारे संघटित करतात.

piece-picking पासून सुरुवात करण्याचा Tutor चा निर्णयही अर्थपूर्ण आहे. हे व्यावसायिकदृष्ट्या संबंधित आहे, पुरेसे पुनरावृत्तीशील आहे की भरपूर उदाहरणे तयार होतील, आणि physical विविधताही इतकी आहे की manipulation ची कसोटी लागू शकेल. हीच ती वैशिष्ट्ये आहेत जी एखाद्या कामाला business application आणि training substrate दोन्ही म्हणून उपयुक्त बनवतात.

Physical AI ला अजूनही पुरावा हवा आहे, पण सिद्धांत सुसंगत आहे

Tutor Intelligence ने अजून सिद्ध केलेले नाही की त्यांचा data-factory दृष्टिकोन सर्वसाधारणपणे सक्षम robot intelligence देईल. हे warehouse-style कामांमध्ये जलद सुधारणा दाखवण्यापेक्षा खूप मोठे विधान आहे. तरीही, कंपनीचे गृहितक नाकारायला कठीण आहे. रोबोट्स ज्या जगाला त्यांनी स्पर्शच केलेला नाही, त्या जगाबद्दल फक्त मानवी भाषेतून शिकू शकत नाहीत. कधीतरी कोणालातरी त्यांना physical reality मध्ये शिकवावेच लागेल.

DF1 त्या शिकवण्याच्या प्रक्रियेला scale करण्याचा प्रयत्न आहे. विखुरलेल्या deployments मधून रोबोट्स योगायोगाने शिकतील, अशी वाट पाहण्याऐवजी Tutor instruction ला एक संसाधन म्हणून निर्माण करणारे वातावरण बांधत आहे. कंपनी ते संसाधन अधिक जुळवून घेणाऱ्या वर्तनात रूपांतरित करू शकली, तर simulation-first approaches पेक्षा physical AI साठी अधिक व्यवहार्य मार्ग ठरवण्यास मदत होऊ शकते.

सध्या Tutor चे महत्त्व पूर्ण उत्तर देण्यात कमी आणि robot data collection ला समर्पित पायाभूत सुविधांना योग्य ठरतील अशी औद्योगिक समस्या म्हणून हाताळण्यात अधिक आहे. प्रभावी demos पासून विश्वासार्ह utility कडे सर्वात जलद मार्ग शोधणाऱ्या क्षेत्रात ही एक गंभीर कल्पना आहे.

हा लेख The Robot Report मधील वार्तांकनावर आधारित आहे. मूळ लेख वाचा.

Originally published on therobotreport.com