రోబోటిక్స్ పరిశోధకులు ప్రతిస్పందనాత్మక ఎఐను దాటి ముందుకు సాగుతున్నారు
నేటి రోబోటిక్స్ వ్యవస్థలలోని ప్రధాన బలహీనతలలో ఒకటి, వాటిలో చాలావరకు కెమెరా ఏమి చూస్తుందో దానిని యంత్రం చేయాల్సిన తదుపరి కదలికకు నేరుగా మ్యాప్ చేయడం నేర్చుకుంటాయి. ఇది ఉపయోగకరమైన ప్రవర్తనను ఇస్తుంది, కానీ అవగాహనలో ఒక ఖాళీని మిగులుస్తుంది. ఒక నిర్దిష్ట చిత్రానికి సాధారణంగా ఏ చర్య అనుసరిస్తుందో రోబో నేర్చుకోవచ్చు, కానీ తన స్వంత చర్య ప్రపంచాన్ని ఎలా మారుస్తుందో నేర్చుకోదు.
ఇచ్చిన నివేదికలో హైలైట్ చేసిన కొత్త సమీక్షా పత్రం, వరల్డ్ యాక్షన్ మోడల్స్ లేదా WAMs, ఆ ఖాళీని మూయడానికి రూపొందించబడ్డాయని వాదిస్తోంది. కేవలం పరిశీలనలను చర్యలతో జతచేయడం బదులు, ఈ మోడల్స్ చర్య తీసుకున్న తర్వాత వాతావరణం ఎలా మారే అవకాశం ఉందో కూడా అంచనా వేస్తాయి. ప్రాయోగికంగా, కదలడానికి ముందు స్వల్పకాలిక పరిణామాలను రోబోలకు అనుకరించే మార్గాన్ని ఇవి ఇస్తాయి.
అది ఎందుకు ముఖ్యమో
దాని ప్రాయోగిక వాగ్దానం గణనీయమైనది. అమలు ముందు తన కదలిక ఫలితాన్ని ఒక రోబో మోడల్ చేయగలిగితే, అది పరిచయం లేని వస్తువులు మరియు సెట్టింగ్లకు మరింత మెరుగుగా సాధారణీకరించగలదు. ఇది రోబోటిక్స్లో ఒక ప్రధాన సవాలు; వ్యవస్థలు తరచుగా సంకుచిత శిక్షణ పరిస్థితుల్లో బాగా పనిచేసి, వాతావరణం మారినప్పుడు పనితీరు తగ్గుతుంది.
ఇచ్చిన నివేదిక మరో ప్రయోజనాన్ని కూడా సూచిస్తోంది: శిక్షణ డేటా. సాంప్రదాయ రోబోటిక్స్ వ్యవస్థలు తరచుగా రోబో చర్యలకు లేబుళ్లు ఉన్న డేటాసెట్లపై ఆధారపడతాయి, అవి తయారు చేయడం ఖరీదైనదీ, నెమ్మదిగానూ ఉంటుంది. వరల్డ్ యాక్షన్ మోడల్స్ లేబుల్ లేని రోజువారీ వీడియో నుంచి, మొదటి వ్యక్తి ఫుటేజ్ను కూడా కలుపుకొని, నేర్చుకోవచ్చు; ఎందుకంటే అవి కేవలం ఆదేశాలను మాత్రమే నేర్చుకోవడం లేదు. అవి చర్యలు మరియు మారుతున్న దృశ్య ప్రపంచం మధ్య సంబంధాన్ని నేర్చుకుంటున్నాయి.
రెండు ప్రధాన డిజైన్ శాఖలు రూపుదిద్దుకుంటున్నాయి
సమీక్ష ప్రకారం, సుమారు వంద పత్రాలు ఈ మోడల్ వర్గానికి సరిపోతాయి, మరియు రచయితలు వాటిని రెండు విస్తృత నిర్మాణ కుటుంబాలుగా సమూహీకరిస్తున్నారు. ఒక విధానం ముందుగా అంచనా వేసిన భవిష్య వీడియోను సృష్టించి, ఆ అంచనానుంచి నియంత్రణ ఆదేశాలను ఉత్పత్తి చేస్తుంది. మరొకటి దృశ్య ఇన్పుట్లు మరియు చర్యలను సమాంతరంగా కలిసి ప్రాసెస్ చేస్తుంది.
ఈ విభజన ముఖ్యమైనది, ఎందుకంటే ఈ రంగం ఒంటరి ప్రయోగాల నుండి అంతర్గత నిర్మాణం కలిగిన గుర్తించదగిన పరిశోధనా ప్రాంతంగా ఎదుగుతోందని ఇది చూపిస్తోంది. 2024 తరువాత ఈ శాఖలు ఎలా విస్తరించాయో సర్వే అనుసరిస్తూ, అంచనా మరియు నియంత్రణను కలపడానికి ప్రయత్నించే వ్యవస్థలను పోల్చేందుకు రోబోటిక్స్ పరిశోధకులకు ఒక భాగస్వామ్య రూపకల్పనను అందిస్తోంది.
పూర్తిగా ప్రపంచ మోడళ్లకన్నా ముందుకు
ఇచ్చిన వ్యాసం ఒక ముఖ్యమైన తేడాను సూచిస్తోంది. ఒక స్వచ్ఛమైన వీడియో జనరేటర్ సాధ్యమైన భవిష్య ఫ్రేమ్లను సృష్టించగలదు, కానీ అది మాత్రమే నియంత్రణకు ఉపయోగకరంగా ఉండదు. వరల్డ్ యాక్షన్ మోడల్స్ ఒకేసారి రెండు అవసరాలను తీర్చేందుకు ఉద్దేశించబడ్డాయి: వాతావరణం యొక్క తదుపరి స్థితిని అంచనా వేయడం, అలాగే ఆ అంచనాను నేరుగా చర్య ఉత్పత్తితో అనుసంధానించడం.
ఇది WAMsను ముఖ్యంగా సంబంధించినవిగా చేస్తుంది, ఎందుకంటే రోబోటిక్స్ రంగం ఆకట్టుకునే డెమోల నుంచి మరింత నమ్మదగిన embodied వ్యవస్థల వైపు కదలడానికి ప్రయత్నిస్తోంది. సమీప భవిష్యత్తును ఊహించి, దాన్ని మోటార్ నిర్ణయాలతో కలిపి చూడగల రోబో, కేవలం ప్రతిస్పందనతో కాకుండా ముందుచూపుతో పనిచేయడానికి మరింత దగ్గరగా ఉంటుంది.
మరింత అనుకూలమైన రోబోట్ల వైపు ఒక అడుగు
వరల్డ్ యాక్షన్ మోడల్స్ ఇంకా ఒక పరిశోధనా ఫ్రేమ్వర్క్ మాత్రమే, పూర్తి ఉత్పత్తి వర్గం కాదు. కానీ ఇచ్చిన నివేదికలో వివరించిన సర్వే, అవి రోబోటిక్స్ ఏఐ తదుపరి తరంగానికి ఒక ముఖ్యమైన వ్యవస్థీకరణ ఆలోచనగా మారవచ్చని సూచిస్తోంది. ఈ విధానం ఉద్దేశించినట్లుగా పనిచేస్తే, రోబోలు మరింత తక్కువ సున్నితమైనవి, అత్యంత జాగ్రత్తగా ఎంపిక చేసిన లేబుళ్లపై తక్కువ ఆధారపడేవి, మరియు చర్య తీసుకునే ముందు సంభావ్య పరిణామాలను తర్కించి అపరిచిత వాతావరణాలను నిర్వహించడంలో మరింత సామర్థ్యవంతంగా మారవచ్చు.
ఈ వ్యాసం The Decoder చేసిన నివేదిక ఆధారంగా ఉంది. అసలు వ్యాసాన్ని చదవండి.
Originally published on the-decoder.com



