Boston Dynamics ने Spot को बेहतर बनाने के लिए Gemini का इस्तेमाल किया

एक छोटा-सा ऐलान, लेकिन रोबोटिक्स के लिए बड़ा संकेत

Boston Dynamics का कहना है कि वह Spot को अधिक स्मार्ट बनाने के लिए Google DeepMind के Gemini का इस्तेमाल कर रही है, और कंपनी इस मॉडल को AIVI-Learning में बेहतर तर्क-क्षमता और अनुकूलनशीलता लाने का तरीका बता रही है। उपलब्ध स्रोत पाठ संक्षिप्त है, लेकिन रणनीतिक दिशा साफ है। रोबोटिक्स की सबसे पहचानी जाने वाली कंपनियों में से एक अब गति और नियंत्रण से आगे बढ़कर ऐसे सिस्टम्स की ओर जा रही है जो स्थितियों की अधिक लचीले ढंग से व्याख्या कर सकें।

यह इसलिए महत्वपूर्ण है क्योंकि रोबोटिक्स ने लंबे समय से संरचित कार्यों में उत्कृष्ट प्रदर्शन किया है, लेकिन अव्यवस्थित परिस्थितियों में उसे संघर्ष करना पड़ा है। जब वातावरण अनुमानित हो, नियम स्थिर हों, और संभावित कार्रवाइयों की सीमा संकीर्ण हो, तब रोबोट बेहद भरोसेमंद हो सकते हैं। चुनौती तब शुरू होती है जब परिस्थितियाँ बदलती हैं, निर्देश अस्पष्ट हो जाते हैं, या किसी मशीन को सख्ती से लिखी गई क्रमबद्ध प्रक्रिया का पालन किए बिना यह तय करना होता है कि आगे क्या करना है। इसलिए इस संदर्भ में “तर्क-क्षमता” और “अनुकूलनशीलता” केवल विपणन शब्द नहीं हैं। वे इस क्षेत्र की सबसे कठिन और अब तक अनसुलझी इंजीनियरिंग समस्याओं में से एक की ओर संकेत करते हैं।

Spot इस बदलाव के लिए विशेष रूप से उपयोगी मंच है। यह चौपाया रोबोट पहले से ही उन स्थानों में गतिशीलता से जुड़ा है जो मनुष्यों के लिए कठिन या असुरक्षित हैं, और इसका मूल्य केवल अच्छी तरह चलने में नहीं, बल्कि यह समझने में भी है कि वह क्या देख रहा है और उसे कैसे प्रतिक्रिया देनी चाहिए। यदि Gemini, Boston Dynamics के संकेत के अनुसार, AIVI-Learning को बेहतर बनाता है, तो इसका लाभ केवल अधिक प्राकृतिक भाषा संवाद तक सीमित नहीं होगा। यह वास्तविक वातावरण में रोबोटिक व्यवहार को कम नाज़ुक बनाने के बारे में होगा।

व्यवहार में “तर्क-क्षमता” का अर्थ

रोबोटिक्स में बेहतर तर्क-क्षमता का अर्थ मानव-स्तरीय अमूर्त बुद्धिमत्ता होना जरूरी नहीं है। इसका मतलब अक्सर धारणा को क्रिया से अधिक प्रभावी ढंग से जोड़ना होता है। किसी रोबोट को किसी दृश्य की व्याख्या करनी पड़ सकती है, यह अनुमान लगाना पड़ सकता है कि क्या महत्वपूर्ण है, प्रतिस्पर्धी कार्यों में से चुनना पड़ सकता है, और वातावरण बदलने पर समायोजन करना पड़ सकता है। इस श्रृंखला में मामूली प्रगति भी किसी सिस्टम को कहीं अधिक उपयोगी बना सकती है, क्योंकि इससे लगातार मानवीय निगरानी और पहले से प्रोग्राम की गई आकस्मिक योजनाओं की जरूरत कम होती है।

अनुकूलनशीलता भी उतनी ही व्यावहारिक है। जो रोबोट केवल सावधानी से तैयार किए गए वातावरण में काम करता है, उसकी आर्थिक उपयोगिता सीमित होती है। जो रोबोट लेआउट, रोशनी, बाधाओं या निर्देशों में बदलाव को संभाल सकता है, वह अधिक मांग वाले औद्योगिक और फील्ड-डिप्लॉयमेंट्स में जा सकता है। यही कारण है कि यहां बताया गया संयोजन उल्लेखनीय है। Boston Dynamics हार्डवेयर, मूवमेंट और डिप्लॉयमेंट अनुभव लाती है। Gemini को एक ऐसी परत के रूप में रखा जा रहा है जो व्याख्या और निर्णय-निर्माण को बेहतर बना सकती है।

इस घोषणा में AIVI-Learning का महत्व एक व्यापक रुझान की ओर भी इशारा करता है। रोबोटिक्स कंपनियों को अब ऐसे सिस्टम्स की अधिक जरूरत है जो केवल काम निष्पादित न करें, बल्कि सीखें और सामान्यीकृत भी करें। पारंपरिक ऑटोमेशन अब भी शक्तिशाली है, लेकिन वह अक्सर बहुत मेहनत से की गई सेटअप पर निर्भर रहता है। AI-सहायता प्राप्त दृष्टिकोण सेटअप समय घटाने और रोबोट्स को एक परिदृश्य से दूसरे में उपयोगी व्यवहार ले जाने में सक्षम बनाने का लक्ष्य रखते हैं। कम-से-कम यही वादा है, और उद्योग ने अभी तक इसे पूरी तरह निभाया नहीं है।

Sakana AI bets AI that improves itself can break the compute arms race of frontier labs

Sakana AI ने recursive self-improvement के लिए लैब बनाई

Sakana AI ने recursive self-improvement के लिए एक समर्पित लैब बनाई है, और तर्क दिया है कि अपनी ही नींव को बेहतर बनाने वाली AI प्रणालियाँ compute arms race का एक विकल्प दे सकती हैं।

Read article

यह साझेदारी क्षेत्र की दिशा से क्यों मेल खाती है

रोबोटिक्स क्षेत्र भौतिक प्रणालियों और बड़े AI मॉडलों के बीच अधिक घनिष्ठ एकीकरण की ओर बढ़ रहा है। इसका आकर्षण समझना आसान है। फाउंडेशन मॉडल्स ने दिखाया है कि वे भाषा, छवियों और पैटर्न पहचान को बड़े पैमाने पर संभाल सकते हैं। दूसरी ओर, भौतिक रोबोट्स को अभी भी उस व्यापक क्षमता को भरोसेमंद क्रिया में बदलने के बेहतर तरीकों की जरूरत है। दोनों को साथ लाना अगला स्पष्ट कदम है, भले ही समझ और निष्पादन के बीच तकनीकी अंतर अभी भी बहुत बड़ा हो।

Boston Dynamics शून्य से शुरुआत नहीं कर रही है। उसके रोबोट पहले से ही सक्षम गति और ऑटोनॉमी के परिष्कृत प्रदर्शन के लिए जाने जाते हैं। लेकिन केवल गतिशीलता किसी मशीन को सामान्य-उद्देश्य वाली नहीं बनाती। उपयोगी ऑटोनॉमी के लिए लक्ष्यों, संदर्भ और अपवादों पर निर्णय लेने की क्षमता चाहिए। यहीं एक ऐसा मॉडल, जिसे तर्क-क्षमता और अनुकूलनशीलता में सुधार करने वाला बताया गया है, यदि वह वास्तविक संचालन-सीमाओं के भीतर अच्छा प्रदर्शन करे, तो असाधारण प्रभाव डाल सकता है।

हालांकि बाधाओं वाले पक्ष को नजरअंदाज नहीं किया जाना चाहिए। भौतिक प्रणालियों को ऐसी मजबूती चाहिए जो अक्सर सॉफ्टवेयर उत्पादों में नहीं होती। कोई चैटबॉट अटपटे उत्तर के लिए माफ किया जा सकता है। लेकिन लोगों, उपकरणों या असमतल जमीन के आसपास काम करने वाले रोबोट को किसी स्थिति की गलत व्याख्या करने पर इतनी आसानी से माफ नहीं किया जा सकता। इसलिए AI-सक्षम रोबोटिक्स की हर प्रगति को केवल नवीनता से नहीं, बल्कि स्थिरता, सुरक्षा और गलती होने पर रिकवरी की क्षमता से भी आंका जाना चाहिए।

आगे क्या देखना है

अब मुख्य सवाल यह नहीं है कि AI मॉडल रोबोट्स से जुड़ेंगे या नहीं। यह तो पहले से ही पूरे उद्योग में हो रहा है। असली सवाल यह है कि इस एकीकरण से कितनी व्यावहारिक क्षमता जुड़ती है। Boston Dynamics का कहना है कि Gemini, AIVI-Learning के जरिए Spot की तर्क-क्षमता और अनुकूलनशीलता को बेहतर बनाएगा। अगला प्रमाण यह होगा कि क्या ये सुधार डेमो से बाहर उन कामों में दिखते हैं जो महत्वपूर्ण हैं: निरीक्षण, नेविगेशन, ऑपरेटर इंटरैक्शन और बदलते वातावरण में संचालन।

अगर ऐसा होता है, तो यह घोषणा रोबोटिक्स में एक व्यापक मोड़ का हिस्सा दिखेगी। अगर नहीं होता, तब भी यह इस उद्योग की उस सहमति को दर्शाएगी कि बेहतर धारणा और बेहतर भाषा अपने-आप पर्याप्त नहीं हैं। रोबोट्स को लूप में बेहतर निर्णय-निर्माण चाहिए। किसी भी स्थिति में, Gemini को चुनना यह रेखांकित करता है कि प्रतिस्पर्धी दबाव किस दिशा में बन रहा है: केवल प्रभावशाली ढंग से चलने वाली मशीनें बनाने में नहीं, बल्कि ऐसी मशीनें बनाने में जो अधिक प्रभावी ढंग से तय कर सकें कि वास्तव में किस तरह की गति की जरूरत है।

यही वह कठिन मध्यभूमि है जहां आधुनिक रोबोटिक्स शायद जीती या हारी जाएगी। हार्डवेयर क्षमता रोबोट को कमरे तक पहुंचाती है। तर्क-क्षमता और अनुकूलनशीलता तय करती हैं कि वहां पहुंचने के बाद वह कोई मूल्यवान काम कर पाएगा या नहीं।

यह लेख The Robot Report की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on therobotreport.com

Boston Dynamics ने Spot की बेहतर तर्क-क्षमता के लिए Gemini का सहारा लिया

एक छोटा-सा ऐलान, लेकिन रोबोटिक्स के लिए बड़ा संकेत

व्यवहार में “तर्क-क्षमता” का अर्थ

Sakana AI ने recursive self-improvement के लिए लैब बनाई

यह साझेदारी क्षेत्र की दिशा से क्यों मेल खाती है

आगे क्या देखना है

Comments (0)

Keep Reading