लहान घोषणा, पण रोबोटिक्ससाठी मोठे सूचक
Boston Dynamics म्हणते की Spot अधिक स्मार्ट करण्यासाठी ती Google DeepMind चे Gemini वापरत आहे, आणि कंपनी हे मॉडेल AIVI-Learning मध्ये अधिक चांगली तर्कक्षमता आणि अनुकूलनशीलता आणण्याचा मार्ग म्हणून मांडते. दिलेला स्रोत मजकूर लहान असला तरी धोरणात्मक दिशा स्पष्ट आहे. रोबोटिक्समधील सर्वाधिक ओळखल्या जाणाऱ्या कंपन्यांपैकी एक आता हालचाल आणि नियंत्रण यापलीकडे जाऊन परिस्थिती अधिक लवचिकपणे समजू शकणाऱ्या systems कडे वाटचाल करत आहे.
हे महत्त्वाचे आहे, कारण रोबोटिक्सने दीर्घकाळ संरचित कामांमध्ये उत्कृष्ट कामगिरी केली आहे, पण गोंधळलेल्या परिस्थितींमध्ये संघर्ष केला आहे. वातावरण अंदाज करता येण्यासारखे असेल, नियम निश्चित असतील, आणि संभाव्य क्रियांची मर्यादा अरुंद असेल, तर robots अत्यंत विश्वासार्ह ठरू शकतात. आव्हान तेव्हा सुरू होते जेव्हा परिस्थिती बदलते, सूचना अस्पष्ट होतात, किंवा एखाद्या मशीनला काटेकोर स्क्रिप्टेड क्रम न पाळता पुढे काय करायचे हे ठरवावे लागते. त्यामुळे या संदर्भात “तर्कक्षमता” आणि “अनुकूलनशीलता” हे केवळ marketing extras नाहीत. ते या क्षेत्रातील सर्वांत कठीण, अजूनही न सुटलेल्या engineering समस्यांपैकी एका दिशेने निर्देश करतात.
या संक्रमणासाठी Spot हे विशेषतः उपयुक्त platform आहे. हा quadruped robot मानवांसाठी कठीण किंवा असुरक्षित असलेल्या जागांमधील हालचालींशी आधीच जोडलेला आहे, आणि त्याचे मूल्य केवळ चांगले चालण्यात नाही, तर तो काय पाहतो आहे आणि कशी प्रतिक्रिया द्यावी हे समजून घेण्यातही आहे. Boston Dynamics सूचित केल्याप्रमाणे Gemini जर AIVI-Learning सुधारत असेल, तर त्याचा फायदा फक्त अधिक नैसर्गिक भाषा संवादापुरता मर्यादित राहणार नाही. तो प्रत्यक्ष वातावरणातील robotic वर्तन कमी brittle बनवण्याबद्दल असेल.
प्रयोगात “तर्कक्षमता” म्हणजे काय
रोबोटिक्समध्ये चांगली तर्कक्षमता म्हणजे मानवी अर्थाने abstract intelligence असणे आवश्यक नाही. याचा अर्थ बहुतेकदा perception आणि action यांना अधिक प्रभावीपणे जोडणे असा होतो. एखाद्या robot ला दृश्य समजून घ्यावे लागू शकते, कोणते घटक महत्त्वाचे आहेत हे ओळखावे लागू शकते, स्पर्धात्मक कामांमधून निवड करावी लागू शकते, आणि वातावरण बदलल्यावर जुळवून घ्यावे लागू शकते. या साखळीतील अगदी छोटे सुधारले तरी एखादे system खूप अधिक उपयुक्त ठरू शकते, कारण त्यामुळे सतत मानवी देखरेख आणि आधीच प्रोग्राम केलेल्या contingency-ची गरज कमी होते.
अनुकूलनशीलताही तितकीच व्यावहारिक आहे. जे robot फक्त काळजीपूर्वक तयार केलेल्या वातावरणात काम करतात, त्यांची आर्थिक व्याप्ती मर्यादित असते. जे robot layout, lighting, obstacles, किंवा instructions मधील बदलांना तोंड देऊ शकतात, ते अधिक मागणी असलेल्या industrial आणि field deployments मध्ये जाऊ शकतात. म्हणूनच येथे वर्णन केलेली जोडी लक्षवेधी आहे. Boston Dynamics hardware, movement, आणि deployment अनुभव घेऊन येते. Gemini ला एक असा layer म्हणून मांडले जात आहे जो interpretation आणि decision-making सुधारू शकतो.
घोषणेत AIVI-Learning चे महत्त्व मोठ्या trend कडेही इशारा करते. रोबोटिक्स कंपन्यांना आता असे systems हवे आहेत जे फक्त काम पार पाडत नाहीत, तर शिकतात आणि सामान्यीकरणही करतात. पारंपरिक automation अजूनही शक्तिशाली आहे, पण ती अनेकदा कष्टपूर्वक केलेल्या setup वर अवलंबून असते. AI-assisted approaches setup time कमी करण्याचा आणि एका scenario मधून दुसऱ्यात उपयुक्त वर्तन नेण्याचा प्रयत्न करतात. किमान तेच promise आहे, आणि तो promise उद्योगाने अजून पूर्णपणे दिलेला नाही.
ही भागीदारी क्षेत्राच्या दिशेशी का जुळते
रोबोटिक्स क्षेत्र भौतिक systems आणि मोठ्या AI models यांच्यात अधिक घट्ट integration कडे जात आहे. त्याचे आकर्षण समजणे सोपे आहे. Foundation models ने दाखवले आहे की ते भाषा, images, आणि pattern recognition मोठ्या प्रमाणावर हाताळू शकतात. दरम्यान, भौतिक robots ना अजूनही त्या व्यापक क्षमतेचे विश्वसनीय कृतीत रूपांतर करण्यासाठी चांगल्या पद्धतींची गरज आहे. दोन्ही एकत्र आणणे हे पुढचे स्पष्ट पाऊल आहे, जरी understanding आणि execution यांच्यातील तांत्रिक दरी अजूनही मोठी असेल.
Boston Dynamics शून्यातून सुरुवात करत नाही. तिचे robots आधीपासून सक्षम हालचाल आणि polished autonomy demonstrations साठी ओळखले जातात. पण केवळ mobility मुळे एखादे मशीन general-purpose बनत नाही. उपयुक्त autonomy साठी goals, context, आणि exceptions याबाबत निर्णयक्षमता हवी. म्हणूनच reasoning आणि adaptability सुधारतील असे वर्णन केलेले model, जर ते प्रत्यक्ष operational constraints मध्ये चांगले कार्य करत असेल, तर त्याचा प्रभाव फार मोठा ठरू शकतो.
तथापि constraint बाजू दुर्लक्षित करता कामा नये. भौतिक systems ना software products पेक्षा वेगळ्या प्रकारची robustness लागते. एखाद्या chatbot ला अडखळणाऱ्या उत्तरासाठी माफ करता येते. पण माणसे, उपकरणे, किंवा असमान जमिनीच्या जवळ कार्य करणाऱ्या robot ला परिस्थिती चुकीची समजल्यास इतक्या सहज माफी देता येत नाही. त्यामुळे AI-enabled robotics मधील प्रत्येक प्रगतीचे मूल्यमापन केवळ novelty वर नाही, तर consistency, safety, आणि काही चूक झाल्यास recover होण्याच्या क्षमतेवरही केले पाहिजे.
पुढे काय पाहायचे
आता मुख्य प्रश्न हा नाही की AI models robots शी जोडले जातील का. ते आधीपासूनच उद्योगभर होत आहे. खरा प्रश्न म्हणजे त्या integration मुळे किती व्यावहारिक क्षमता वाढते. Boston Dynamics म्हणते की Gemini AIVI-Learning द्वारे Spot ची तर्कक्षमता आणि अनुकूलनशीलता सुधारेल. पुढचा proof point म्हणजे हे सुधारणा demos बाहेर अशा कामांमध्ये दिसतात का जे महत्त्वाचे आहेत: inspection, navigation, operator interaction, आणि बदलत्या वातावरणात operation.
जर तसे झाले, तर ही घोषणा रोबोटिक्समधील व्यापक वळणाचा भाग वाटेल. जर तसे झाले नाही, तरीही हा उद्योगातील त्या सहमतीचे प्रतिबिंब असेल की अधिक चांगली perception आणि अधिक चांगली भाषा एकटी पुरेशी नाहीत. Robots ला loop मध्ये अधिक मजबूत decision-making हवी. कुठल्याही परिस्थितीत, Gemini ची निवड हे दाखवते की स्पर्धात्मक दबाव कुठे वाढतो आहे: केवळ प्रभावीपणे हालचाल करणारी machines बनवण्यात नव्हे, तर प्रत्यक्षात कोणती हालचाल आवश्यक आहे हे अधिक परिणामकारकपणे ठरवू शकणारी machines बनवण्यात.
आधुनिक रोबोटिक्स जिथे जिंकली किंवा हरली जाईल ती ही कठीण मधली जमीन आहे. Hardware capability robot ला खोलीत आणते. Reasoning आणि adaptability ठरवतात की तो तिथे पोहोचल्यानंतर काही मूल्यवान करू शकतो की नाही.
हा लेख The Robot Report च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.
Originally published on therobotreport.com

