प्रत्यक्ष जगातील दृष्टी बिघडली की रोबोट्स अजूनही अडखळतात

रोबोटिक्स तैनातीतील दरीची सुरुवात बहुतेकदा स्वीकारल्या जाण्यापेक्षा perception मधूनच होते

The Robot Report मधील एका नव्या निबंधात असा दावा करण्यात आला आहे की रोबोटिक्समधील सर्वात हट्टी समस्यांपैकी एक म्हणजे आकर्षक स्वायत्तता किंवा प्रगत नियोजन नाही, तर नियंत्रित परिस्थितीबाहेर कोसळणारी perception. Orbbec चे अभियांत्रिकी कार्यकारी David Chen, एक परिचित नमुना वर्णन करतात: डेमोमध्ये रोबोट सुरळीत काम करतो, पण नंतर बदलत्या प्रकाशमानात, परावर्तक पृष्ठभागांवर, पारदर्शक साहित्यांवर, कंपनात, माणसांमध्ये आणि फोर्कलिफ्टच्या वाहतुकीत तैनात केल्यावर अडचणीत येतो.

मुद्दा असा नाही की artificial intelligence अपयशी ठरली आहे. मुद्दा असा आहे की अनेक प्रत्यक्ष जगातील अपयशे उच्च-स्तरीय reasoning ला मदत करण्याची संधी मिळण्यापूर्वीच सुरू होतात. जर रोबोटचा depth map चुकीचा, अतिआत्मविश्वासी किंवा अस्थिर असेल, तर planning आणि manipulation स्तरांना खराब input वारसाहक्काने मिळतो. त्यामुळे मूळ कारण perception, calibration, किंवा कमकुवत confidence estimation असताना ते motion किंवा task-planning समस्येसारखे दिसू शकते.

अनेक तैनातींसाठी 2D vision पुरेशी का नाही

हा निबंध 3D vision systems, depth cameras, आणि sensor fusion यांच्यासाठी थेट बाजू मांडतो. पारंपरिक 2D cameras ओळख, तपासणी आणि tracking साठी उपयुक्त राहतात, पण त्या depth थेट मोजत नाहीत. Depth चा अंदाज motion, multi-view geometry, किंवा learned priors वापरून बांधता येतो, पण प्रकाश, texture, occlusion, किंवा materials बदलल्यावर त्या पद्धती अनेकदा मोडतात.

ही निरीक्षण महत्त्वाची आहे कारण आधुनिक robotics आता fixed, structured settings मधून warehouses, hospitals, आणि mixed industrial environments कडे अधिकाधिक जात आहे. अशा ठिकाणी robots ना flat imagery मधून घेतलेल्या सर्वोत्तम अंदाजाऐवजी भौतिक जगातून spatial measurementsची गरज असते. म्हणून, विश्वासार्ह तैनाती task आणि environment यांना प्रतिबिंबित करणाऱ्या sensing modalities निवडण्यावर अवलंबून असते, फक्त benchmark वर नव्हे.

OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need"

OpenAI चे रोबोटिक्स इन्फ्रास्ट्रक्चर काम आणि दीर्घकालीन ग्राहकदृष्टीभोवती पुन्हा उभारले जात आहे

OpenAI ने आपली रोबोटिक्स टीम पुन्हा उभी केली आहे, सुरुवात इन्फ्रास्ट्रक्चर कामांपासून करत, तर CEO Sam Altman सर्वांसाठी वैयक्तिक रोबोट हा दीर्घकालीन उद्देश सांगतात.

Read article

Depth sensing एकच गोष्ट नाही

Chen चा लेख हेही ठळक करतो की depth sensing स्वतः एकच तंत्रज्ञान नाही. तो robotic vision च्या अनेक पिढ्यांमधून मार्गक्रमण करतो, ज्यात structured light systems आणि त्यांच्याशी संबंधित tradeoffs समाविष्ट आहेत. Structured light indoor inspection आणि measurement साठी चांगले काम करू शकते, पण ती ambient light, motion, reflective surfaces, transparent materials, आणि इतर active emitters कडून होणाऱ्या interference प्रति संवेदनशील असू शकते.

हा मुद्दा उपयुक्त आहे कारण robotics चर्चांमध्ये perception ला अनेकदा एकसंध क्षमता म्हणून सरळ केले जाते. प्रत्यक्षात, sensing performance कोणती physical method वापरली जाते, ती कुठे वापरली जाते, आणि रोबोटला कोणत्या प्रकारच्या वस्तू किंवा materials हाताळाव्या लागतात यावर मोठ्या प्रमाणात अवलंबून असते.

लपलेली समस्या म्हणजे confidence

निबंधातील अधिक तीक्ष्ण ओळींपैकी एक अशी आहे की depth map बरोबर वाटत असला तरी चुकीचा असल्यास रोबोट त्याभोवती विश्वासार्हपणे planning करू शकत नाही. हे एका मोठ्या engineering आव्हानाकडे निर्देश करते. Perception systems ना केवळ accuracy पुरेशी नसते; त्यांना विश्वासार्ह uncertainty estimatesही हवे असतात. आवाजातच अपयशी होणारी प्रणाली कधी कधी हाताळता येते. पण जी प्रणाली चुकीची असूनही आत्मविश्वासपूर्ण दिसते आणि शांतपणे अपयशी ठरते, ती सुरक्षित आणि कार्यक्षमपणे deploy करणे फार कठीण असते.

रोबोट्स कमी structured spaces मध्ये जात असताना ही समस्या विशेषतः महत्त्वाची ठरते. चमक असलेला warehouse floor, अनपेक्षितपणे हालचाल करणारे लोक असलेला hospital corridor, किंवा विविध materials असलेली manufacturing line या सर्वांमधून sensing ambiguity निर्माण होऊ शकते. जर रोबोट ही ambiguity योग्यरित्या दर्शवू शकला नाही, तर downstream decision-making brittle बनते.

सामाजिक शास्त्रात एआय कोडिंग-एजंटचा वापर तीव्रपणे असमान असल्याचे अभ्यासात आढळले

Anthropic च्या अभ्यासात सामाजिक शास्त्रात कोडिंग-एजंट स्वीकारात मोठी तफावत आढळली, ज्यामध्ये लिंग, शाखा, करिअर टप्पा आणि विद्यापीठ क्रमवारीनुसार अंतर दिसले.

Read article

स्त्रोत थेट काय समर्थित करतो

दिलेला source text लेखातील मुख्य दावे स्पष्टपणे समर्थित करतो. प्रत्यक्ष तैनातीमध्ये बदलणारे प्रकाशमान, परावर्तक पृष्ठभाग, पारदर्शक साहित्य, हालचाल करणारे लोक, कंपन, आणि इतर घटक येतात, जे डेमोमध्ये न दिसणाऱ्या कमतरता उघड करतात. निबंध असा युक्तिवाद करतो की robotic perception विश्वासार्ह, task-specific, आणि वास्तविक operating conditions अंतर्गत मोजण्याजोगे असावे. तो असेही सांगतो की 3D vision systems, depth cameras, आणि sensor fusion हे robotics deployment चे केंद्र बनले आहेत.

हा लेख robot-vision hardware विकणाऱ्या कंपनीतील एका executive ने लिहिलेला असल्यामुळे, तो त्या संदर्भासह वाचला पाहिजे. तरीही, तांत्रिक निदान robotics मधील व्यापकपणे मान्य असलेल्या समस्येशी जुळते: staged demonstrations मधून robust operation कडे जाण्याचा बदल अजूनही sensing quality मुळे मर्यादित राहतो.

हे आत्ता का महत्त्वाचे आहे

Robotics अशा टप्प्यात प्रवेश करत आहे जिथे अपेक्षा प्रत्यक्ष तैनातीच्या वास्तवापेक्षा वेगाने विस्तृत होत आहेत. Investors, customers, आणि platform developers increasingly robots ना अधिक open-ended environments आणि अधिक विविध tasks हाताळतील अशी अपेक्षा करत आहेत. ही बदलती अपेक्षा सर्वप्रथम perception stacks वर दबाव टाकते. Demo अजूनही आखीव-पाकीव असू शकतो. Commercial environment तसे करू शकत नाही.

त्यामुळे perception engineering हे background subsystem न राहता strategic differentiator बनत आहे. ज्या कंपन्या वास्तव परिस्थितीत sensing अधिक विश्वासार्ह बनवू शकतात, त्या proof-of-concept आणि revenue यांच्यातील अंतर कमी करतील. ज्या कंपन्या तसे करू शकत नाहीत, त्या प्रभावी दिसणारे पण सर्वत्र लागू न होणारे demonstrations देत राहतील.

Anthropic bans AI tools during job interviews to see how candidates actually think

उमेदवारांची चाचणी घेण्यासाठी Anthropic ने मुलाखतींमध्ये AI साधनांवर बंदी घातली

Anthropic थेट नोकरीच्या मुलाखतींमध्ये AI मदत, स्पष्ट परवानगी नसल्यास, निषिद्ध करते, कारण कंपनी उमेदवार स्वतंत्रपणे कसा विचार करतो हे तपासू इच्छिते.

Read article

मुख्य निष्कर्ष

निबंधाचा युक्तिवाद शेवटी सर्वोत्तम अर्थाने सावध आहे: demo काम करत असल्यामुळे robotics teams नी perception ला solved मानणे थांबवायला हवे. प्रत्यक्ष deployment साठी असे sensing आवश्यक आहे जे calibrated, measurable, आणि गोंधळलेल्या परिस्थितीतही टिकाऊ असेल.

हा संदेश प्राथमिक वाटू शकतो, पण तो अजूनही या क्षेत्रातील सर्वात कठीण सत्यांपैकी एक आहे. Robots अजूनही प्रत्यक्ष जग नीट पाहण्यात अडखळतात कारण प्रत्यक्ष जग प्रयोगशाळेसारखे वागण्यास नकार देते.

हा लेख The Robot Report च्या अहवालावर आधारित आहे. मूळ लेख वाचा.

Originally published on therobotreport.com

रोबोट्स अजूनही डेमोच्या बाहेर अपयशी ठरतात कारण दृष्टी सर्वप्रथम बिघडते

रोबोटिक्स तैनातीतील दरीची सुरुवात बहुतेकदा स्वीकारल्या जाण्यापेक्षा perception मधूनच होते

अनेक तैनातींसाठी 2D vision पुरेशी का नाही

OpenAI चे रोबोटिक्स इन्फ्रास्ट्रक्चर काम आणि दीर्घकालीन ग्राहकदृष्टीभोवती पुन्हा उभारले जात आहे

Depth sensing एकच गोष्ट नाही

लपलेली समस्या म्हणजे confidence

सामाजिक शास्त्रात एआय कोडिंग-एजंटचा वापर तीव्रपणे असमान असल्याचे अभ्यासात आढळले

स्त्रोत थेट काय समर्थित करतो

हे आत्ता का महत्त्वाचे आहे

उमेदवारांची चाचणी घेण्यासाठी Anthropic ने मुलाखतींमध्ये AI साधनांवर बंदी घातली

मुख्य निष्कर्ष

Comments (0)

Related Articles

MISUMI ने $1 अब्ज AI उत्पादन दाव्यासह Americas मोहीम सुरू केली

Keep Reading