रोबोटिक्स में उछाल असल में सीखने के तरीकों की कहानी है

ह्यूमनॉइड रोबोटिक्स एक बार फिर गंभीर पूंजी आकर्षित कर रहा है, लेकिन सबसे महत्वपूर्ण बदलाव सौंदर्यात्मक महत्वाकांक्षा या विज्ञान-कथा मार्केटिंग नहीं है। यह पद्धतिगत बदलाव है। उत्साह की ताज़ा लहर इस बात से जुड़ी है कि रोबोट्स को दुनिया में काम करने के लिए कैसे प्रशिक्षित किया जाता है, और यही बदलाव एक लंबे समय से चली आ रही आकांक्षा को अधिक निवेश-योग्य क्षेत्र में बदलने में मदद कर रहा है।

स्रोत सामग्री के अनुसार, कंपनियों और निवेशकों ने 2025 में ह्यूमनॉइड रोबोट्स में 6.1 अरब डॉलर लगाए, जो 2024 में निवेशित राशि का चार गुना है। यह अपने-आप में एक चौंकाने वाला आंकड़ा है। लेकिन इस उछाल का अधिक ठोस कारण वह है जिस पर लेख ज़ोर देता है: रोबोटिक्स अब मुख्य रूप से painstakingly hand-coded नियमों पर निर्भर रहने से हटकर ऐसे learning forms की ओर बढ़ गया है, जो अव्यवस्थित वास्तविक दुनिया के वातावरण के लिए अधिक उपयुक्त हैं।

पुराना तरीका कहाँ अटक गया

कई वर्षों तक रोबोटिक्स ने सैद्धांतिक रूप से ऊँचा लक्ष्य रखा, लेकिन व्यावहारिक रूप से सीमित रहा। शोधकर्ता ऐसे adaptable, helpful machines चाहते थे जो अलग-अलग वातावरणों में चल सकें और लोगों के साथ सुरक्षित रूप से बातचीत कर सकें। फिर भी क्षेत्र का वास्तविक आउटपुट काफी हद तक specialized और constrained रहा। लेख इस असंतुलन को विज्ञान-कथा की महत्वाकांक्षाओं और औद्योगिक भुजाओं तथा घरेलू रोबोटों की वास्तविकता के बीच एक तेज़ अंतर के रूप में पेश करता है।

रोबोटिक्स के पुराने तरीके में इंजीनियरों को पहले से संभावनाओं का अनुमान लगाना और उन्हें स्पष्ट रूप से कोड करना पड़ता था। उदाहरण के लिए, यदि किसी रोबोट को कपड़े मोड़ने थे, तो इंजीनियरों को कॉलर पहचानने, आस्तीन ढूँढ़ने, घुमाव के अनुसार समायोजन करने, सिलवटों को ठीक करने और deformation नियंत्रित करने के नियम तय करने पड़ते थे। यह सख्ती से सीमित कार्यों में काम कर सकता है, लेकिन जैसे-जैसे वातावरण अधिक परिवर्तनशील होता है, नियमों की संख्या तेज़ी से बढ़ती जाती है।

इस दृष्टिकोण ने संरचित वातावरण में भरोसेमंद प्रणालियाँ दीं, लेकिन generalize करना कठिन रहा। जितना अधिक रोबोट को अनिश्चित वस्तुओं, बदलती परिस्थितियों और अधूरी जानकारी से निपटना पड़ता, उतनी ही अधिक brittle hand-authored instruction sets बनती गईं।

सीखने की ओर बदलाव

लेख 2015 के आसपास एक मोड़ की ओर संकेत करता है, जब उन्नत रोबोटिक्स ने simulated training और trial-and-error improvement की ओर रुख किया। हर निर्देश को मैन्युअल रूप से लिखने के बजाय, शोधकर्ता डिजिटल वातावरण बना सकते थे, सफलता के लिए reward signals तय कर सकते थे, और प्रणालियों को बार-बार प्रयास करके सुधारने दे सकते थे। यह अवधारणा कुछ शुरुआती AI प्रणालियों के खेल सीखने के तरीके से मिलती-जुलती है।

इस बदलाव का महत्व इसलिए था क्योंकि इसने काम का केंद्र बदल दिया। भौतिक दुनिया के हर संभावित मामले को गिनने की कोशिश करने के बजाय, इंजीनियर ऐसे वातावरण, लक्ष्य और मॉडल डिज़ाइन करने पर ध्यान दे सकते थे जो अनुभव से उपयोगी व्यवहार सीख सकें। इससे कठिनाई खत्म नहीं हुई। वास्तविक दुनिया की रोबोटिक्स अब भी बेहद कठोर है। लेकिन इसने क्षेत्र को व्यापक machine-learning क्रांति के साथ अधिक संगत बना दिया।

अगला तेज़ी वाला चरण 2022 के बाद आया, जब बड़े भाषा मॉडल्स ने दिखाया कि बड़े डेटासेट्स पर प्रशिक्षित प्रणालियाँ शक्तिशाली predictors बन सकती हैं। स्रोत के अनुसार, रोबोटिक्स के लिए अनुकूलित ऐसे मॉडल images, sensor readings और joint positions ले सकते हैं, और फिर रोबोट को अगला कौन-सा action लेना चाहिए, यह predict कर सकते हैं। यह rule-based programming और pure trial-and-error loops दोनों से एक महत्वपूर्ण विकास है।

निवेशक अब क्यों ध्यान दे रहे हैं

पूँजी आम तौर पर क्षमता में बदलाव का अनुसरण करती है, सिर्फ कहानी में बदलाव का नहीं। लेख का संकेत है कि निवेशक इस विश्वास पर प्रतिक्रिया दे रहे हैं कि रोबोट अब ऐसे तरीकों से सीख सकते हैं जो भौतिक वातावरण की अनिश्चितता के अधिक अनुकूल हैं। एक ऐसी प्रणाली जो multimodal inputs absorb कर सकती है और अगले actions infer कर सकती है, वह उस प्रणाली से अधिक practical adaptability के करीब लगती है, जिसमें इंजीनियरों को पहले से हर edge case script करना पड़े।

ह्यूमनॉइड श्रेणी में यह विशेष रूप से महत्वपूर्ण है। निवेशक सिर्फ इसलिए ह्यूमनॉइड्स पर दांव नहीं लगा रहे कि वे परिचित दिखते हैं। वे इस संभावना पर दांव लगा रहे हैं कि अधिक general-purpose learning methods आखिरकार अधिक general-purpose machines को समर्थन दे सकती हैं।

यह अब भी एक प्रस्ताव है, पूर्ण तथ्य नहीं। लेख स्पष्ट है कि जिन मशीनों की कई लोग कल्पना करते हैं, वे अभी पूरी तरह बनी नहीं हैं। लेकिन funding boom दिखाता है कि बाज़ार कुछ साल पहले की तुलना में aspiration और execution के बीच की दूरी को कम मान रहा है।

गहरा महत्व

वर्तमान क्षण का असली महत्व यह है कि रोबोटिक्स आधुनिक AI stack में और अधिक कसकर जुड़ रही है। Prediction-आधारित मॉडल, simulation में प्रशिक्षित प्रणालियाँ, और richer sensor fusion सभी रोबोटिक्स को ऐसे regime की ओर ले जाते हैं जहाँ प्रगति पहले की तुलना में तेज़ी से compound हो सकती है।

यह अपने-आप व्यापक घरेलू उपयोग या श्रम-परिवर्तन की गारंटी नहीं देता। रोबोटिक्स को अभी भी hardware cost, safety, durability, deployment complexity, और नियंत्रित वातावरण के बाहर विश्वसनीय संचालन की चुनौती से जूझना है। लेकिन स्रोत में वर्णित learning breakthrough क्षेत्र के केंद्र-गुरुत्व को बदल देता है।

यह उपयोगिता पर बातचीत को भी नए ढंग से प्रस्तुत करता है। किसी रोबोट को आर्थिक रूप से महत्वपूर्ण बनने के लिए शुरुआत में flawless general servant होने की ज़रूरत नहीं है। यदि नए learning methods मशीनों को कम brittle programming के साथ कार्यों की व्यापक श्रेणी संभालने दें, तो वे क्रमिक रूप से मूल्यवान बन सकती हैं, पहले सीमित लेकिन कम सख्त वातावरणों में, फिर संभवतः उनसे आगे।

एक नया अध्याय, पूरी कहानी नहीं

2025 का रोबोटिक्स उछाल अचानक चमत्कार से कम और वर्षों से बन रहे तकनीकी पुनर्संयोजन का परिणाम अधिक दिखता है। क्षेत्र हर आकस्मिक स्थिति का अनुमान लगाने से आगे बढ़कर ऐसे systems बनाने की ओर गया है जो data, simulation और multimodal context से action patterns सीख सकते हैं। निवेशकों ने यह बदलाव नोट किया है, और 6.1 अरब डॉलर का आंकड़ा उस बदलाव को रेखांकित करता है।

यह पैसा स्थायी परिणाम देगा या नहीं, यह इस पर निर्भर करेगा कि ये learning methods कितनी अच्छी तरह promising demonstrations से विश्वसनीय physical systems में बदलती हैं। लेकिन लेख एक मजबूत दलील देता है कि कुछ मौलिक बदल चुका है। रोबोटिक्स अब केवल बेहतर नियम लिखकर आगे नहीं बढ़ रही। यह इस बात को बदलकर आगे बढ़ रही है कि मशीनें आगे क्या करना है, यह कैसे सीखती हैं।

यह लेख MIT Technology Review की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on technologyreview.com