Boston Dynamics Spot-কে আরও স্মার্ট করতে Gemini ব্যবহার করছে

ছোট একটি ঘোষণা, কিন্তু রোবোটিক্সের জন্য বড় তাৎপর্য

Boston Dynamics বলছে, Spot-কে আরও স্মার্ট করতে তারা Google DeepMind-এর Gemini ব্যবহার করছে, এবং কোম্পানিটি এই মডেলকে AIVI-Learning-এ আরও ভালো রিজনিং ও অভিযোজন ক্ষমতা আনার উপায় হিসেবে বর্ণনা করেছে। সরবরাহ করা সোর্স টেক্সটটি সংক্ষিপ্ত, তবে কৌশলগত দিকটি স্পষ্ট। রোবোটিক্সের সবচেয়ে পরিচিত কোম্পানিগুলোর একটি এখন শুধু গতি ও নিয়ন্ত্রণের সীমা ছাড়িয়ে এমন সিস্টেমের দিকে এগোচ্ছে, যা পরিস্থিতিকে আরও নমনীয়ভাবে ব্যাখ্যা করতে পারে।

এটি গুরুত্বপূর্ণ, কারণ রোবোটিক্স দীর্ঘদিন ধরে কাঠামোবদ্ধ কাজগুলোতে দারুণ সফল, কিন্তু জটিল ও এলোমেলো পরিস্থিতিতে হোঁচট খেয়েছে। পরিবেশ পূর্বানুমানযোগ্য হলে, নিয়ম স্থির থাকলে, এবং সম্ভাব্য কাজের পরিধি ছোট হলে রোবট অত্যন্ত নির্ভরযোগ্য হতে পারে। কিন্তু সমস্যা শুরু হয় যখন পরিস্থিতি বদলায়, নির্দেশ অস্পষ্ট হয়ে পড়ে, বা কোনো যন্ত্রকে কঠোরভাবে লেখা ধারাবাহিক ধাপ মেনে না চলেই পরবর্তী পদক্ষেপ ঠিক করতে হয়। তাই এই প্রসঙ্গে “রিজনিং” এবং “অভিযোজন ক্ষমতা” কোনো বিপণন-অতিরিক্ত বিষয় নয়। এগুলো ক্ষেত্রটির সবচেয়ে কঠিন, এখনো অমীমাংসিত প্রকৌশল সমস্যাগুলোর একটির দিকে ইঙ্গিত করে।

এই রূপান্তরের জন্য Spot বিশেষভাবে উপযোগী একটি প্ল্যাটফর্ম। চারপেয়ে এই রোবট এমন জায়গায় চলাচলের সঙ্গে যুক্ত, যা মানুষের জন্য কঠিন বা অনিরাপদ, এবং এর মূল্য শুধু ভালোভাবে হাঁটতে পারার মধ্যে নয়, বরং এটি কী দেখছে এবং কীভাবে প্রতিক্রিয়া জানানো উচিত তা বোঝার মধ্যেও। যদি Boston Dynamics-এর ইঙ্গিত অনুযায়ী Gemini AIVI-Learning উন্নত করে, তবে সেই লাভ শুধু স্বাভাবিক ভাষা-ভিত্তিক যোগাযোগে সীমিত থাকবে না। বিষয়টি হবে বাস্তব পরিবেশে রোবোটিক আচরণকে কম ভঙ্গুর করা।

ব্যবহারে “রিজনিং” মানে কী

রোবোটিক্সে ভালো রিজনিং মানে মানবিক অর্থে বিমূর্ত বুদ্ধিমত্তা থাকা জরুরি নয়। এটি অনেক সময় উপলব্ধি ও কর্মকে আরও কার্যকরভাবে যুক্ত করার কথা বোঝায়। একটি রোবটকে কোনো দৃশ্য ব্যাখ্যা করতে হতে পারে, কোন বিষয়টি প্রাসঙ্গিক তা অনুমান করতে হতে পারে, প্রতিযোগী কাজের মধ্যে সিদ্ধান্ত নিতে হতে পারে, এবং পরিবেশ বদলালে নিজেকে মানিয়ে নিতে হতে পারে। এই শৃঙ্খলে সামান্য উন্নতিও একটি সিস্টেমকে অনেক বেশি কার্যকর করে তুলতে পারে, কারণ এতে ক্রমাগত মানব তত্ত্বাবধান এবং আগেভাগে প্রোগ্রাম করা ব্যতিক্রমী পরিস্থিতির প্রয়োজন কমে যায়।

অভিযোজন ক্ষমতাও একইভাবে ব্যবহারিক। যে রোবট কেবল খুব যত্নে প্রস্তুত করা পরিবেশে কাজ করে, তার অর্থনৈতিক পরিসর সীমিত। যে রোবট বিন্যাস, আলো, বাধা বা নির্দেশের ভিন্নতার সঙ্গে মানিয়ে নিতে পারে, সে আরও চাহিদাপূর্ণ শিল্প ও ফিল্ড ডেপ্লয়মেন্টে যেতে পারে। এই কারণেই এখানে বর্ণিত জুটি উল্লেখযোগ্য। Boston Dynamics নিয়ে আসে হার্ডওয়্যার, চলাচল, এবং ডেপ্লয়মেন্টের অভিজ্ঞতা। Gemini-কে এমন একটি স্তর হিসেবে স্থাপন করা হচ্ছে, যা ব্যাখ্যা ও সিদ্ধান্ত-গ্রহণ উন্নত করতে পারে।

ঘোষণায় AIVI-Learning-এর গুরুত্ব আরও বড় একটি প্রবণতার দিকেও ইঙ্গিত করে। রোবোটিক্স কোম্পানিগুলো এখন এমন সিস্টেম চায়, যা শুধু কাজ চালাবে না, বরং শিখবে এবং সাধারণীকরণও করবে। প্রচলিত অটোমেশন এখনো শক্তিশালী, কিন্তু তা অনেক সময় অত্যন্ত যত্নসাপেক্ষ সেটআপের ওপর নির্ভরশীল। AI-সহায়তাপ্রাপ্ত পদ্ধতি সেটআপের সময় কমাতে এবং একটি পরিস্থিতি থেকে আরেকটিতে রোবটকে উপযোগী আচরণ বহন করতে সাহায্য করতে চায়। অন্তত সেটাই প্রতিশ্রুতি, আর শিল্প এখনও তা পুরোপুরি পূরণ করতে পারেনি।

OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need"

OpenAI-র রোবোটিক্স আবার গড়ে উঠছে অবকাঠামো কাজ ও দীর্ঘমেয়াদি ভোক্তা-দৃষ্টির চারপাশে

OpenAI তাদের রোবোটিক্স দল পুনর্গঠন করেছে, শুরু হচ্ছে অবকাঠামো কাজ দিয়ে, আর CEO Sam Altman দীর্ঘমেয়াদে সবার জন্য ব্যক্তিগত রোবটের লক্ষ্য বলছেন।

Read article

কেন এই অংশীদারিত্ব ক্ষেত্রটির দিকের সঙ্গে মানানসই

রোবোটিক্স খাত এখন ভৌত সিস্টেম এবং বড় AI মডেলের মধ্যে আরও ঘনিষ্ঠ সমন্বয়ের দিকে এগোচ্ছে। এর আকর্ষণ বোঝা সহজ। ফাউন্ডেশন মডেল দেখিয়েছে যে তারা ভাষা, ছবি, এবং প্যাটার্ন শনাক্তকরণকে বড় পরিসরে সামলাতে পারে। অন্যদিকে, ভৌত রোবটদের এখনও সেই বিস্তৃত সক্ষমতাকে নির্ভরযোগ্য ক্রিয়ায় রূপান্তরের আরও ভালো উপায় দরকার। দুটিকে একসঙ্গে আনা একটি স্পষ্ট পরবর্তী পদক্ষেপ, যদিও বোঝা এবং বাস্তবায়নের মধ্যে প্রযুক্তিগত ফাঁক এখনও অনেক বড়।

Boston Dynamics শূন্য থেকে শুরু করছে না। এর রোবটগুলো ইতিমধ্যেই সক্ষম চলাচল এবং পরিশীলিত স্বায়ত্তশাসনের প্রদর্শনের জন্য পরিচিত। কিন্তু শুধু গতিশীলতা দিয়ে কোনো মেশিনকে সাধারণ-উদ্দেশ্যসম্পন্ন করা যায় না। কার্যকর স্বায়ত্তশাসনের জন্য লক্ষ্য, প্রসঙ্গ, এবং ব্যতিক্রম সম্পর্কে বিচারক্ষমতা দরকার। তাই রিজনিং ও অভিযোজন ক্ষমতা উন্নত করার দাবিযুক্ত কোনো মডেল, যদি তা বাস্তব পরিচালনাগত সীমাবদ্ধতার মধ্যে ভালো কাজ করে, তাহলে তার প্রভাব হতে পারে অত্যন্ত বড়।

তবে সীমাবদ্ধতার দিকটি উপেক্ষা করা যাবে না। ভৌত সিস্টেমের ক্ষেত্রে এমন দৃঢ়তা দরকার, যা অনেক সময় সফটওয়্যার পণ্যে লাগে না। একটি চ্যাটবটের অস্বস্তিকর উত্তর মাফ করা যায়। কিন্তু মানুষ, যন্ত্রপাতি, বা অসম মাটির আশপাশে কাজ করা একটি রোবট কোনো পরিস্থিতি ভুল পড়লে সহজে ক্ষমা পাওয়া যায় না। তাই AI-চালিত রোবোটিক্সের প্রতিটি অগ্রগতি কেবল নতুনত্ব দিয়ে নয়, বরং স্থিতিশীলতা, নিরাপত্তা, এবং কিছু ভুল হলে পুনরুদ্ধারের ক্ষমতা দিয়েও বিচার করতে হবে।

পরের ধাপে কী দেখার আছে

এখন মূল প্রশ্নটি আর এই নয় যে AI মডেল রোবটের সঙ্গে যুক্ত হবে কি না। সেটা ইতিমধ্যেই শিল্পজুড়ে ঘটছে। আসল প্রশ্ন হলো, এই একীকরণ কতটা বাস্তব সক্ষমতা যোগ করে। Boston Dynamics বলছে, Gemini AIVI-Learning-এর মাধ্যমে Spot-এর রিজনিং এবং অভিযোজন ক্ষমতা উন্নত করবে। পরবর্তী প্রমাণ হবে, এই উন্নতি কি ডেমোর বাইরে এমন কাজে দেখা যায় যেগুলো সত্যিই গুরুত্বপূর্ণ: পরিদর্শন, নেভিগেশন, অপারেটরের সঙ্গে মিথস্ক্রিয়া, এবং পরিবর্তনশীল পরিবেশে কাজ করা।

যদি তা হয়, তবে এই ঘোষণা রোবোটিক্সের একটি বৃহত্তর মোড়ের অংশ বলে মনে হবে। যদি না হয়, তবুও এটি দেখাবে যে শিল্পে এই উপলব্ধি দৃঢ় হচ্ছে: ভালো উপলব্ধি এবং ভালো ভাষা একা যথেষ্ট নয়। রোবটদের লুপের মধ্যে আরও শক্তিশালী সিদ্ধান্ত-গ্রহণ দরকার। যাই হোক, Gemini বেছে নেওয়া দেখিয়ে দিচ্ছে প্রতিযোগিতার চাপ কোন দিকে তৈরি হচ্ছে: শুধু চমৎকারভাবে চলতে পারে এমন মেশিন বানানো নয়, বরং এমন মেশিন বানানো, যা আরও কার্যকরভাবে নির্ধারণ করতে পারে আসলে কোন ধরনের গতি দরকার।

এটাই সেই কঠিন মধ্যভূমি, যেখানে আধুনিক রোবোটিক্স সম্ভবত জিতবে বা হারবে। হার্ডওয়্যারের সক্ষমতা একটি রোবটকে ঘরের ভেতরে আনে। রিজনিং এবং অভিযোজন ক্ষমতা নির্ধারণ করে, সেখানে পৌঁছানোর পর সেটি কিছু মূল্যবান কাজ করতে পারবে কি না।

এই নিবন্ধটি The Robot Report-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.

গবেষণা বলছে, সামাজিক বিজ্ঞানে এআই কোডিং-এজেন্টের ব্যবহার খুবই অসম

একটি Anthropic গবেষণায় দেখা গেছে, সামাজিক বিজ্ঞানে কোডিং-এজেন্ট গ্রহণে বড় বৈষম্য রয়েছে, যা লিঙ্গ, ক্ষেত্র, ক্যারিয়ার পর্যায় এবং বিশ্ববিদ্যালয়ের র‌্যাঙ্ক অনুযায়ী ভিন্ন।

Read article

Originally published on therobotreport.com

Boston Dynamics Spot-এর আরও ভালো রিজনিংয়ের জন্য Gemini-র দিকে ঝুঁকছে

ছোট একটি ঘোষণা, কিন্তু রোবোটিক্সের জন্য বড় তাৎপর্য

ব্যবহারে “রিজনিং” মানে কী

OpenAI-র রোবোটিক্স আবার গড়ে উঠছে অবকাঠামো কাজ ও দীর্ঘমেয়াদি ভোক্তা-দৃষ্টির চারপাশে

কেন এই অংশীদারিত্ব ক্ষেত্রটির দিকের সঙ্গে মানানসই

পরের ধাপে কী দেখার আছে

গবেষণা বলছে, সামাজিক বিজ্ঞানে এআই কোডিং-এজেন্টের ব্যবহার খুবই অসম

Comments (0)

Related Articles

MISUMI AI-চালিত উৎপাদনে $1 বিলিয়ন বাজি ধরে Americas অভিযান শুরু করল

Keep Reading