रोबोटिक्समधील डेटा समस्या

एक रोबोटला भौतिक जगतात वस्तूंची हाताळणी करण्यास शिकवणे ऐतिहासिकदृष्ट्या मानव-संग्रहीत प्रदर्शन डेटाची विशाल मात्रा आवश्यक आहे. Google DeepMind चे RT-1 सिस्टमला मानव ऑपरेटरद्वारे 17 महिन्यांमध्ये संकलित 130,000 एपिसोडचा डेटा आवश्यक होता. DROID डेटासेटमध्ये 13 संशोधन संस्थांमध्ये संकलित 76,000 दूरवरून नियंत्रित ट्रेजेक्टोरीज आहेत — लगभग 350 तासांच्या मानव प्रयत्नाचे प्रतिनिधित्व करतात. या संख्या केवळ आव्हानाचे आकार नाही तर त्यातून उत्पन्न होणारा आर्थिक केंद्रीकरण प्रतिबिंबित करतात: केवळ थोड्याशा संख्येत संपन्न प्रयोगशाळांना स्पर्धात्मक हाताळणी प्रणालीला प्रशिक्षण देण्यासाठी आवश्यक डेटा संकलित करण्यास परवानगी आहे.

Allen Institute for AI — Ai2 — MolmoBot सह एक वेगळा मॉडेल प्रस्तावित करत आहे, एक रोबोटिक हाताळणी प्रणाली मुख्यतः व्हर्च्युअल सिम्युलेशनमधील डेटाद्वारे प्रशिक्षित केली जाते, भौतिक प्रदर्शनांऐवजी. संशोधन हे दाखवते की हा सिम्युलेशन-प्रशिक्षित मॉडेल त्याची क्षमता वास्तविक भौतिक रोबोट सिस्टममध्ये स्थानांतरित करू शकतो, एक परिणाम जो सक्षम रोबोटिक हाताळणी AI ला लोकशाहीकरण करू शकतो.

सिम्युलेशन ऐतिहासिकदृष्ट्या स्थानांतरण मध्ये अयशस्वी का रहिले

सिम्युलेशन कार्यक्षमता आणि वास्तविक-जगत कार्यक्षमता यातील अंतर — 'sim-to-real gap' — एक स्थायी अडचण रहिली आहे. भौतिक रोबोटला संवेदी इनपुटची समृद्धता, पर्यावरणीय परिवर्तनशीलता आणि संपर्क गतिशीलता यांचा सामना करावा लागतो जो सिम्युलेशन वातावरणांना विश्वसनीयरित्या प्रतिकृती करण्यास संघर्ष करते. पूर्णपणे सिम्युलेशनमध्ये प्रशिक्षित केलेला रोबोट बहुधा वास्तविक-विश्व गोंधळ हाताळू शकत नाही जो त्याच्या प्रशिक्षण वातावरणाने अमूर्त केलेला आहे.

या अंतर दूर करण्याचे मागील प्रयत्न domain randomization वर अवलंबून आहेत — प्रकाश, वस्तूची बनावट, आणि भौतिकी गुणधर्मांसारख्या सिम्युलेशन पॅरामीटरला जाणूनबुजून बदलून रोबोटांना अशी प्रस्तुतीकरण विकसित करण्यास भाग पाडले जाते जे परिस्थितीत सामान्य करते. या पद्धतीने अंगमार्जनामध्ये आंशिक यश मिळवले आहे परंतु बारीक गतीच्या नियंत्रणाची आणि अचूक संपर्क बल व्यवस्थापनाची आवश्यकता असणाऱ्या दक्ष हाताळणी कार्यांसाठी ते कमी प्रभावी आहे.

MolmoBot चा दृष्टिकोन

MolmoBot Ai2 च्या Molmo vision-language मॉडेलवर बांधलेला आहे, जो प्रणालीला व्हिज्युअल दृश्य आणि भाषा सूचनांची समृद्ध समज प्रदान करतो. मुख्य नवीनता असल्याचा कसा सिम्युलेशन डेटा व्युत्पन्न केला जातो आणि हाताळणी प्रशिक्षणासाठी कसा तपास केला जातो. एकच सिम्युलेशन वातावरण वापरण्याऐवजी, संघाने विविध हाताळणी परिस्थितीचा निर्माण करण्यासाठी एक पाइपलाइन विकसित केली ज्यामध्ये सामान्यीकरणीय कौशल्य प्रशिक्षित करण्यासाठी पर्याप्त भौतिक विश्वसनीयता आहे.

प्रणाली संपर्क गतिशीलतामध्ये सुधारित सिम्युलेशन विश्वसनीयता प्रतिनिधित्व शिक्षण दृष्टिकोनाशी एकत्रित करते जो स्पष्टपणे सिम्युलेटेड आणि वास्तविक परिवेशांमधील व्हिज्युअल फरकांमध्ये अपरिवर्तनीयता बनवतो. रोबोट कार्य-प्रासंगिक व्हिज्युअल वैशिष्ट्य — gripper स्थान, हाताळली जाणारी वस्तू, लक्ष्य स्थान — ओळखायला शिकतो ज्या सिम्युलेशन आणि वास्तविकतामध्ये सारख्या दिसतात, सिम्युलेशन-विशिष्ट व्हिज्युअल कलाकृती एन्कोडिंग करणारी प्रस्तुतीकरण शिकण्याऐवजी.

लोकशाहीकरणाचा तर्क

सिम्युलेशन-आधारित प्रशिक्षणाचा आर्थिक तर्क सरलीकृत आहे. सिम्युलेशन डेटा व्युत्पन्न करण्यासाठी कंप्यूट अवसंरचना आवश्यक आहे परंतु भौतिक रोबोट नाहीत, प्रशिक्षित मानव ऑपरेटर नाहीत, आणि मोठ्या प्रदर्शन डेटासेटला एकत्रित करण्यासाठी आवश्यक संस्थागत समन्वय नाही. एक संगणन क्लस्टरला प्रवेश असणाऱ्या लहान विश्वविद्यालयातील संशोधन संघ संपन्न प्रयोगशाळाला हजारांच्या दहाई भौतिक प्रदर्शन संकलित करण्यास लागणाऱ्या वेळेमध्ये लाखो सिम्युलेटेड हाताळणी एपिसोड व्युत्पन्न करू शकते.

जर सिम्युलेशन-प्रशिक्षित मॉडेल्स भौतिकदृष्ट्या प्रशिक्षित प्रणालीच्या कार्यक्षमतेशी जुळू शकत असतील किंवा लगावू शकत असतील — जे MolmoBot च्या परिणामांनी हाताळणी कार्यांच्या अर्थपूर्ण वर्गासाठी साध्य होणे सूचित केले आहे — रोबोटिक हाताळणी AI च्या क्षमता एक व्यापक संशोधन समुदायास उपलब्ध बनतात.

खुला प्रकाशन

Ai2 च्या संशोधन तत्वज्ञानाशी सरिसृप, MolmoBot प्रणाली आणि त्याची सिम्युलेशन प्रशिक्षण पाइपलाइन खुलेपणाने प्रकाशित केली जात आहेत. सिम्युलेटेड हाताळणी ट्रेजेक्टोरीचा डेटासेट, प्रशिक्षित मॉडेल वजन, आणि सिम्युलेशन वातावरण साधनांचे सर्व संशोधन समुदायास उपलब्ध केले जात आहेत — एक दृष्टिकोन जो व्यावसायिक रोबोटिक्स AI प्रोग्रामच्या मालिकीचे डेटा आणि मॉडेल धोरणांशी थेट विरोधाभास करतो जे क्षेत्रास नेतृत्व दिले आहे. CEO Ali Farhadi याने लक्ष्य स्पष्टपणे सांगितला: AI निर्माण जो विज्ञानला प्रगत करते अशा साधनांद्वारे जे जागतिक संशोधन समुदाय एकत्रितपणे बांधू शकतो.

हा लेख AI News च्या अहवालावर आधारित आहे. मूळ लेख वाचा.

Originally published on artificialintelligence-news.com