वर्ल्ड एक्शन मॉडल्स रोबोटों को आगे बढ़ने से पहले परिणामों का अनुकरण करने में मदद कर सकते हैं

रोबोटिक्स शोधकर्ता प्रतिक्रियात्मक एआई से आगे बढ़ रहे हैं

आज की रोबोटिक्स प्रणालियों की एक मूल कमजोरी यह है कि उनमें से कई यह सीधा मानचित्रण सीखती हैं कि कैमरा जो देखता है, उससे मशीन को अगला कौन-सा आंदोलन करना चाहिए। इससे उपयोगी व्यवहार तो मिल सकता है, लेकिन समझ में एक खालीपन रह जाता है। रोबोट यह तो सीख सकता है कि किसी दी गई छवि के बाद आम तौर पर कौन-सी कार्रवाई आती है, लेकिन यह नहीं सीखता कि उसकी अपनी कार्रवाई दुनिया को कैसे बदलती है।

प्रदान की गई रिपोर्टिंग में उजागर एक नया समीक्षा-पत्र तर्क देता है कि वर्ल्ड एक्शन मॉडल्स, या WAMs, इसी अंतर को भरने के लिए बनाए गए हैं। केवल अवलोकनों को क्रियाओं के साथ जोड़ने के बजाय, ये मॉडल यह भी अनुमान लगाते हैं कि कोई कार्रवाई किए जाने के बाद वातावरण में कैसे बदलाव होने की संभावना है। व्यवहार में, यह रोबोटों को आगे बढ़ने से पहले अल्पकालिक परिणामों का अनुकरण करने का तरीका देता है।

यह क्यों महत्वपूर्ण है

इसका व्यावहारिक वादा महत्वपूर्ण है। यदि कोई रोबोट निष्पादन से पहले अपने आंदोलन के परिणाम का मॉडल बना सकता है, तो वह अपरिचित वस्तुओं और परिवेशों पर बेहतर ढंग से सामान्यीकरण कर सकेगा। यह रोबोटिक्स की एक बड़ी चुनौती है, जहाँ प्रणालियाँ अक्सर सीमित प्रशिक्षण परिस्थितियों में अच्छा प्रदर्शन करती हैं और फिर वातावरण बदलने पर कमजोर पड़ जाती हैं।

प्रदान की गई रिपोर्ट एक और लाभ की ओर भी इशारा करती है: प्रशिक्षण डेटा। पारंपरिक रोबोटिक्स प्रणालियाँ अक्सर ऐसे डेटासेट पर निर्भर करती हैं जिनमें रोबोट क्रियाओं को लेबल किया गया हो, और इसे तैयार करना महंगा तथा धीमा होता है। वर्ल्ड एक्शन मॉडल्स बिना लेबल वाले रोज़मर्रा के वीडियो, जिसमें प्रथम-पुरुष फुटेज भी शामिल है, से सीख सकते हैं, क्योंकि वे केवल आदेश नहीं सीख रहे होते। वे क्रियाओं और बदलती दृश्य दुनिया के बीच संबंध सीख रहे होते हैं।

OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need"

OpenAI ने इन्फ्रास्ट्रक्चर काम और लंबे उपभोक्ता विजन के इर्द-गिर्द रोबोटिक्स को फिर से खड़ा किया है

OpenAI ने अपनी रोबोटिक्स टीम को फिर से बनाया है, शुरुआत इन्फ्रास्ट्रक्चर कार्यों से करते हुए, जबकि CEO Sam Altman एक लंबे समय के लक्ष्य के रूप में सभी के लिए निजी रोबोटों की बात कर रहे हैं।

Read article

दो मुख्य डिज़ाइन शाखाएँ उभर रही हैं

समीक्षा के अनुसार, लगभग सौ शोध-पत्र इस मॉडल वर्ग में आते हैं, और लेखक उन्हें दो व्यापक वास्तुकला परिवारों में बाँटते हैं। एक धारा पहले अनुमानित भविष्य का वीडियो बनाती है और फिर उस पूर्वानुमान से नियंत्रण आदेश निकालती है। दूसरी दृश्य इनपुट और क्रियाओं को समानांतर रूप से संयुक्त रूप से संसाधित करती है।

यह विभाजन महत्वपूर्ण है क्योंकि यह दिखाता है कि क्षेत्र अलग-अलग प्रयोगों से विकसित होकर आंतरिक संरचना वाले एक पहचाने जाने योग्य शोध क्षेत्र में बदल रहा है। सर्वेक्षण 2024 के बाद से इन शाखाओं के विस्तार का पता लगाता है, जिससे रोबोटिक्स शोधकर्ताओं को उन प्रणालियों की तुलना करने के लिए एक साझा ढाँचा मिलता है जो पूर्वानुमान और नियंत्रण को जोड़ने की कोशिश करती हैं।

शुद्ध वर्ल्ड मॉडल्स से आगे

प्रदान किया गया लेख एक महत्वपूर्ण अंतर बताता है। एक शुद्ध वीडियो जनरेटर संभावित भविष्य के फ्रेम बना सकता है, लेकिन केवल इतना होना नियंत्रण के लिए उसे उपयोगी नहीं बनाता। वर्ल्ड एक्शन मॉडल्स से एक साथ दोनों आवश्यकताएँ पूरी होने की अपेक्षा की जाती है: वातावरण की अगली स्थिति की भविष्यवाणी करना और उस पूर्वानुमान को सीधे क्रिया-निर्माण से जोड़ना।

यह WAMs को विशेष रूप से प्रासंगिक बनाता है क्योंकि रोबोटिक्स क्षेत्र प्रभावशाली डेमो से अधिक विश्वसनीय embodied प्रणालियों की ओर बढ़ने की कोशिश कर रहा है। एक रोबोट जो निकट भविष्य की कल्पना कर सकता है और उसे मोटर निर्णयों से जोड़ सकता है, वह केवल प्रतिक्रिया देने के बजाय दूरदर्शिता के साथ कार्य करने के अधिक करीब है।

अध्ययन में पाया गया कि सामाजिक विज्ञान में एआई कोडिंग-एजेंट का उपयोग बेहद असमान है

Anthropic के एक अध्ययन में सामाजिक विज्ञान में कोडिंग-एजेंट अपनाने में बड़े अंतर पाए गए, जो लिंग, क्षेत्र, करियर चरण और विश्वविद्यालय रैंक के आधार पर बदलते हैं।

Read article

अधिक अनुकूलनीय रोबोटों की ओर एक कदम

वर्ल्ड एक्शन मॉडल्स अभी भी एक शोध रूपरेखा हैं, कोई अंतिम उत्पाद श्रेणी नहीं। लेकिन प्रदान की गई रिपोर्टिंग में वर्णित सर्वेक्षण सुझाव देता है कि वे रोबोटिक्स एआई की अगली लहर के लिए एक महत्वपूर्ण संगठक विचार बन सकते हैं। यदि यह दृष्टिकोण अपेक्षा के अनुसार काम करता है, तो रोबोट कम नाज़ुक, अत्यधिक सावधानी से तैयार किए गए लेबलों पर कम निर्भर, और कार्रवाई से पहले संभावित परिणामों पर तर्क करके अपरिचित वातावरणों को संभालने में अधिक सक्षम हो सकते हैं।

यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on the-decoder.com

वर्ल्ड एक्शन मॉडल्स का लक्ष्य रोबोटों को परिणामों का बेहतर बोध देना है

रोबोटिक्स शोधकर्ता प्रतिक्रियात्मक एआई से आगे बढ़ रहे हैं

यह क्यों महत्वपूर्ण है

OpenAI ने इन्फ्रास्ट्रक्चर काम और लंबे उपभोक्ता विजन के इर्द-गिर्द रोबोटिक्स को फिर से खड़ा किया है

दो मुख्य डिज़ाइन शाखाएँ उभर रही हैं

शुद्ध वर्ल्ड मॉडल्स से आगे

अध्ययन में पाया गया कि सामाजिक विज्ञान में एआई कोडिंग-एजेंट का उपयोग बेहद असमान है

अधिक अनुकूलनीय रोबोटों की ओर एक कदम

Comments (0)

Related Articles

AI मॉडल ने रेसिपी की तर्क-प्रणाली को स्वाद-रसायन से अलग किया

MISUMI ने $1 अरब के AI निर्माण दांव के साथ Americas अभियान शुरू किया

Microsoft और Nvidia कथित तौर पर AI PCs को स्थानीय एजेंटों की ओर धकेल रहे हैं

Keep Reading