रोबोटिक्स शोधकर्ता प्रतिक्रियात्मक एआई से आगे बढ़ रहे हैं

आज की रोबोटिक्स प्रणालियों की एक मूल कमजोरी यह है कि उनमें से कई यह सीधा मानचित्रण सीखती हैं कि कैमरा जो देखता है, उससे मशीन को अगला कौन-सा आंदोलन करना चाहिए। इससे उपयोगी व्यवहार तो मिल सकता है, लेकिन समझ में एक खालीपन रह जाता है। रोबोट यह तो सीख सकता है कि किसी दी गई छवि के बाद आम तौर पर कौन-सी कार्रवाई आती है, लेकिन यह नहीं सीखता कि उसकी अपनी कार्रवाई दुनिया को कैसे बदलती है।

प्रदान की गई रिपोर्टिंग में उजागर एक नया समीक्षा-पत्र तर्क देता है कि वर्ल्ड एक्शन मॉडल्स, या WAMs, इसी अंतर को भरने के लिए बनाए गए हैं। केवल अवलोकनों को क्रियाओं के साथ जोड़ने के बजाय, ये मॉडल यह भी अनुमान लगाते हैं कि कोई कार्रवाई किए जाने के बाद वातावरण में कैसे बदलाव होने की संभावना है। व्यवहार में, यह रोबोटों को आगे बढ़ने से पहले अल्पकालिक परिणामों का अनुकरण करने का तरीका देता है।

यह क्यों महत्वपूर्ण है

इसका व्यावहारिक वादा महत्वपूर्ण है। यदि कोई रोबोट निष्पादन से पहले अपने आंदोलन के परिणाम का मॉडल बना सकता है, तो वह अपरिचित वस्तुओं और परिवेशों पर बेहतर ढंग से सामान्यीकरण कर सकेगा। यह रोबोटिक्स की एक बड़ी चुनौती है, जहाँ प्रणालियाँ अक्सर सीमित प्रशिक्षण परिस्थितियों में अच्छा प्रदर्शन करती हैं और फिर वातावरण बदलने पर कमजोर पड़ जाती हैं।

प्रदान की गई रिपोर्ट एक और लाभ की ओर भी इशारा करती है: प्रशिक्षण डेटा। पारंपरिक रोबोटिक्स प्रणालियाँ अक्सर ऐसे डेटासेट पर निर्भर करती हैं जिनमें रोबोट क्रियाओं को लेबल किया गया हो, और इसे तैयार करना महंगा तथा धीमा होता है। वर्ल्ड एक्शन मॉडल्स बिना लेबल वाले रोज़मर्रा के वीडियो, जिसमें प्रथम-पुरुष फुटेज भी शामिल है, से सीख सकते हैं, क्योंकि वे केवल आदेश नहीं सीख रहे होते। वे क्रियाओं और बदलती दृश्य दुनिया के बीच संबंध सीख रहे होते हैं।

दो मुख्य डिज़ाइन शाखाएँ उभर रही हैं

समीक्षा के अनुसार, लगभग सौ शोध-पत्र इस मॉडल वर्ग में आते हैं, और लेखक उन्हें दो व्यापक वास्तुकला परिवारों में बाँटते हैं। एक धारा पहले अनुमानित भविष्य का वीडियो बनाती है और फिर उस पूर्वानुमान से नियंत्रण आदेश निकालती है। दूसरी दृश्य इनपुट और क्रियाओं को समानांतर रूप से संयुक्त रूप से संसाधित करती है।

यह विभाजन महत्वपूर्ण है क्योंकि यह दिखाता है कि क्षेत्र अलग-अलग प्रयोगों से विकसित होकर आंतरिक संरचना वाले एक पहचाने जाने योग्य शोध क्षेत्र में बदल रहा है। सर्वेक्षण 2024 के बाद से इन शाखाओं के विस्तार का पता लगाता है, जिससे रोबोटिक्स शोधकर्ताओं को उन प्रणालियों की तुलना करने के लिए एक साझा ढाँचा मिलता है जो पूर्वानुमान और नियंत्रण को जोड़ने की कोशिश करती हैं।

शुद्ध वर्ल्ड मॉडल्स से आगे

प्रदान किया गया लेख एक महत्वपूर्ण अंतर बताता है। एक शुद्ध वीडियो जनरेटर संभावित भविष्य के फ्रेम बना सकता है, लेकिन केवल इतना होना नियंत्रण के लिए उसे उपयोगी नहीं बनाता। वर्ल्ड एक्शन मॉडल्स से एक साथ दोनों आवश्यकताएँ पूरी होने की अपेक्षा की जाती है: वातावरण की अगली स्थिति की भविष्यवाणी करना और उस पूर्वानुमान को सीधे क्रिया-निर्माण से जोड़ना।

यह WAMs को विशेष रूप से प्रासंगिक बनाता है क्योंकि रोबोटिक्स क्षेत्र प्रभावशाली डेमो से अधिक विश्वसनीय embodied प्रणालियों की ओर बढ़ने की कोशिश कर रहा है। एक रोबोट जो निकट भविष्य की कल्पना कर सकता है और उसे मोटर निर्णयों से जोड़ सकता है, वह केवल प्रतिक्रिया देने के बजाय दूरदर्शिता के साथ कार्य करने के अधिक करीब है।

अधिक अनुकूलनीय रोबोटों की ओर एक कदम

वर्ल्ड एक्शन मॉडल्स अभी भी एक शोध रूपरेखा हैं, कोई अंतिम उत्पाद श्रेणी नहीं। लेकिन प्रदान की गई रिपोर्टिंग में वर्णित सर्वेक्षण सुझाव देता है कि वे रोबोटिक्स एआई की अगली लहर के लिए एक महत्वपूर्ण संगठक विचार बन सकते हैं। यदि यह दृष्टिकोण अपेक्षा के अनुसार काम करता है, तो रोबोट कम नाज़ुक, अत्यधिक सावधानी से तैयार किए गए लेबलों पर कम निर्भर, और कार्रवाई से पहले संभावित परिणामों पर तर्क करके अपरिचित वातावरणों को संभालने में अधिक सक्षम हो सकते हैं।

यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on the-decoder.com