खरे आव्हान फक्त चालणे नाही

ह्युमॅनॉइड रोबोट नियंत्रित प्रात्यक्षिकांमधून माणसांसोबत सामायिक वातावरणात येऊ लागले आहेत, तसा एक प्रश्न शुद्ध हालचालीपेक्षा अधिक केंद्रस्थानी येत आहे: परिस्थिती-जाणीव. The Robot Report मध्ये प्रकाशित अलीकडील उद्योग विश्लेषण म्हणते की ह्युमॅनॉइड प्रणालींनी फक्त तोल सांभाळणे, चालणे आणि वस्तू हाताळणे एवढेच नाही, तर माणसे ओळखणे, वेगाने बदलणाऱ्या परिस्थितीचे अर्थ लावणे आणि हानी टाळण्यासाठी पुरेशा वेगाने प्रतिसाद देणेही आवश्यक आहे.

हा दृष्टिकोन उपयुक्त आहे, कारण तो लक्ष प्रदर्शनातून प्रणाली-अभियांत्रिकीवर नेतो. माणसांच्या जवळ काम करणाऱ्या ह्युमॅनॉइड रोबोटला लोक जसे जवळपास स्वयंचलितपणे वापरतात अशा क्षमता अनुकरण कराव्या लागतात: तोल राखणे, हालणारे अडथळे ओळखणे, दृश्य आणि ध्वनी इनपुट समजून घेणे, आणि वर्तनाचे काही क्षणांत समायोजन करणे. रोबोटिक्समध्ये याचा अर्थ सेन्सर्स, प्रोसेसर्स, संप्रेषण लिंक आणि नियंत्रण लूप्समध्ये पसरलेले घट्ट समन्वयाचे आव्हान.

दृष्टी मूलभूत आहे, पण विलंब ही मर्यादा आहे

अहवाल ह्युमॅनॉइड परिस्थिती-जाणीवेसाठी दृष्टीला प्रारंभबिंदू मानतो. RGB image sensors सामान्य दृश्य इनपुटचे अनुकरण करू शकतात, तर depth time-of-flight, structured light किंवा stereo vision systems द्वारे जोडता येते. पण प्रतिमा गोळा करणे ही केवळ सुरुवात आहे. माहिती रोबोटच्या आत पुरेशा वेगाने नेणे हे खरे कठीण काम आहे, जेणेकरून ती कृतीसाठी उपयोगी ठरेल.

प्रगत रोबोटिक्समध्ये हे आव्हान वारंवार दिसते. कॅमेरे अनेकदा डोके किंवा धडात असतात, तर मुख्य प्रोसेसर दुसरीकडे असतो, त्यामुळे मशीनच्या आत लांब data path तयार होतो. त्या मार्गांमुळे latency येऊ शकते, आणि रोबोट माणसांच्या जवळ जलद हालचाली करत असताना latency धोकादायक ठरते. विश्लेषणात म्हटले आहे की कमी-latency गरजा काही processing संबंधित sensor किंवा actuator जवळ हलवू शकतात, मध्यवर्ती संगणकावर पूर्ण अवलंबून राहण्याऐवजी.

दुसऱ्या शब्दांत, ह्युमॅनॉइड जागरूकता ही केवळ perception समस्या नाही. ती architecture समस्या आहे. रोबोटने पाहिले पाहिजे, पण त्याचबरोबर आपल्या शरीरातून माहिती आणि निर्णय वेळेत प्रवाहित करणेही आवश्यक आहे.

सामायिक जागेत सुरक्षिततेसाठी जलद एकीकरण आवश्यक

लेख अनिश्चिततेबद्दल एक व्यापक मुद्दा मांडतो. माणसे स्थिर अडथळे नाहीत. ते अचानक हलतात, हेतू बदलतात आणि विसंगत वागतात. वेअरहाउस aisle साठी, जिथे चल मर्यादित आहेत, डिझाइन केलेला रोबोट माणसांच्या जवळ सुरक्षित काम करणाऱ्या रोबोटपेक्षा वेगळे कार्य करतो.

याचा अर्थ sensor fusion आणि timing केंद्रस्थानी येतात. दृश्य इनपुट, तोलाची माहिती आणि actuator response यांचे समन्वयन असे झाले पाहिजे की रोबोटभोवती सुरक्षित कार्यक्षेत्र निश्चित होईल आणि ते real time मध्ये अद्ययावत राहील. प्रणाली मंद, विसंगत किंवा ओव्हरलोड असेल, तर ह्युमॅनॉइड डेमोमध्ये सक्षम दिसू शकतो, पण मिश्र वातावरणात प्रत्यक्ष तैनातीसाठी अयोग्य ठरू शकतो.

म्हणूनच ह्युमॅनॉइड स्पर्धा headline videos जितकी जलद दिसते तितकी प्रत्यक्षात नसेल; ती अधिक पायाभूत सुविधांवर अवलंबून असेल. खरी मर्यादा उत्तम हात किंवा अधिक नैसर्गिक चाल नाही. ती अनिश्चिततेखाली deterministic system behavior आहे.

लेख हार्डवेअर स्टॅकबद्दल काय सांगतो

हा लेख Gigabit Multimedia Serial Link, म्हणजे GMSL, या तंत्रज्ञानाकडे निर्देश करतो, जे visual data लांब अंतर्गत अंतरांवर कमी latency सह नेण्यासाठी उपयुक्त आहे. अहवालानुसार हे तंत्रज्ञान automotive systems मध्ये आधीपासून प्रस्थापित असून आता robotics साठीही महत्त्वाचे आहे, कारण दोन्ही क्षेत्रांना कठोर किंवा गतिमान परिस्थितीत sensor data विश्वसनीयपणे वाहून नेण्याची गरज असते.

ही तुलना अर्थपूर्ण आहे. Automotive advanced driver-assistance systems ला आजच्या robotics समोरील अनेक व्यावहारिक समस्यांचे निराकरण करावे लागले होते, ज्यात synchronization, cable constraints आणि वास्तविक परिस्थितीत विश्वसनीय perception यांचा समावेश होतो. ह्युमॅनॉइड रोबोट गाड्या नाहीत, पण त्यांनाही मजबूत sensing pipeline लागते, जे वातावरण गोंधळले तरी फक्त म्हणून अपयशी ठरू नये.

हा लेख उद्योग-प्रायोजित आहे, त्यामुळे कोणत्याही एका तंत्रज्ञान-दाव्याला मर्यादेत पाहणे योग्य आहे. तरीही त्यातील अभियांत्रिकी युक्तिवाद व्यापकपणे विश्वासार्ह आहे: माणसांच्या जवळ काम करणाऱ्या रोबोटांना raw image quality नव्हे, तर latency, synchronization आणि सुरक्षित प्रतिसाद यांभोवती आखलेली perception systems आवश्यक आहेत.

हे आत्ता का महत्त्वाचे आहे

या लेखाचे महत्त्व तो bottleneck कुठे ठेवतो यामध्ये आहे. ह्युमॅनॉइड्सबद्दलची सार्वजनिक चर्चा बहुतेकदा सामान्य-उद्देश robot workers च्या hype आणि mobility demos वर आधारित संशय या दोन टोकांमध्ये झुलते. हे विश्लेषण सांगते की व्यावहारिक bottleneck कदाचित इतरत्र असेल. मानवांसोबत सुसंगत ऑपरेशन machine speed वर अनिश्चितता हाताळू शकणाऱ्या sensing आणि control च्या संपूर्ण stack वर अवलंबून आहे.

जर ते बरोबर असेल, तर ह्युमॅनॉइड्समधील पुढची अर्थपूर्ण प्रगती नाट्यमय हालचालींपेक्षा data transport, local processing आणि sensor integration मधील कमी दिसणाऱ्या पण महत्त्वाच्या सुधारणा यांतून येऊ शकते. या सुधारणा बाजारात मांडायला कठीण असतात, पण त्या रोबोटला केवळ प्रभावी यंत्रणा न राहता अशा प्रणालीत बदलतात जी प्रत्यक्ष कामाच्या ठिकाणी safety liability न बनता प्रवेश करू शकते.

मूळ धडा साधा आहे. ह्युमॅनॉइड रोबोटिक्समध्ये intelligence म्हणजे केवळ planning किंवा language नाही. ती शब्दशः खोली वाचण्याबद्दल आणि इतक्या विश्वासार्ह रीतीने ते करण्याबद्दलही आहे की लोक आपल्या शेजारील यंत्रावर विश्वास ठेवू शकतील.

हा लेख The Robot Report च्या वार्तांकनावर आधारित आहे. मूळ लेख वाचा.

Originally published on therobotreport.com