ছোট একটি ঘোষণা, কিন্তু রোবোটিক্সের জন্য বড় তাৎপর্য
Boston Dynamics বলছে, Spot-কে আরও স্মার্ট করতে তারা Google DeepMind-এর Gemini ব্যবহার করছে, এবং কোম্পানিটি এই মডেলকে AIVI-Learning-এ আরও ভালো রিজনিং ও অভিযোজন ক্ষমতা আনার উপায় হিসেবে বর্ণনা করেছে। সরবরাহ করা সোর্স টেক্সটটি সংক্ষিপ্ত, তবে কৌশলগত দিকটি স্পষ্ট। রোবোটিক্সের সবচেয়ে পরিচিত কোম্পানিগুলোর একটি এখন শুধু গতি ও নিয়ন্ত্রণের সীমা ছাড়িয়ে এমন সিস্টেমের দিকে এগোচ্ছে, যা পরিস্থিতিকে আরও নমনীয়ভাবে ব্যাখ্যা করতে পারে।
এটি গুরুত্বপূর্ণ, কারণ রোবোটিক্স দীর্ঘদিন ধরে কাঠামোবদ্ধ কাজগুলোতে দারুণ সফল, কিন্তু জটিল ও এলোমেলো পরিস্থিতিতে হোঁচট খেয়েছে। পরিবেশ পূর্বানুমানযোগ্য হলে, নিয়ম স্থির থাকলে, এবং সম্ভাব্য কাজের পরিধি ছোট হলে রোবট অত্যন্ত নির্ভরযোগ্য হতে পারে। কিন্তু সমস্যা শুরু হয় যখন পরিস্থিতি বদলায়, নির্দেশ অস্পষ্ট হয়ে পড়ে, বা কোনো যন্ত্রকে কঠোরভাবে লেখা ধারাবাহিক ধাপ মেনে না চলেই পরবর্তী পদক্ষেপ ঠিক করতে হয়। তাই এই প্রসঙ্গে “রিজনিং” এবং “অভিযোজন ক্ষমতা” কোনো বিপণন-অতিরিক্ত বিষয় নয়। এগুলো ক্ষেত্রটির সবচেয়ে কঠিন, এখনো অমীমাংসিত প্রকৌশল সমস্যাগুলোর একটির দিকে ইঙ্গিত করে।
এই রূপান্তরের জন্য Spot বিশেষভাবে উপযোগী একটি প্ল্যাটফর্ম। চারপেয়ে এই রোবট এমন জায়গায় চলাচলের সঙ্গে যুক্ত, যা মানুষের জন্য কঠিন বা অনিরাপদ, এবং এর মূল্য শুধু ভালোভাবে হাঁটতে পারার মধ্যে নয়, বরং এটি কী দেখছে এবং কীভাবে প্রতিক্রিয়া জানানো উচিত তা বোঝার মধ্যেও। যদি Boston Dynamics-এর ইঙ্গিত অনুযায়ী Gemini AIVI-Learning উন্নত করে, তবে সেই লাভ শুধু স্বাভাবিক ভাষা-ভিত্তিক যোগাযোগে সীমিত থাকবে না। বিষয়টি হবে বাস্তব পরিবেশে রোবোটিক আচরণকে কম ভঙ্গুর করা।
ব্যবহারে “রিজনিং” মানে কী
রোবোটিক্সে ভালো রিজনিং মানে মানবিক অর্থে বিমূর্ত বুদ্ধিমত্তা থাকা জরুরি নয়। এটি অনেক সময় উপলব্ধি ও কর্মকে আরও কার্যকরভাবে যুক্ত করার কথা বোঝায়। একটি রোবটকে কোনো দৃশ্য ব্যাখ্যা করতে হতে পারে, কোন বিষয়টি প্রাসঙ্গিক তা অনুমান করতে হতে পারে, প্রতিযোগী কাজের মধ্যে সিদ্ধান্ত নিতে হতে পারে, এবং পরিবেশ বদলালে নিজেকে মানিয়ে নিতে হতে পারে। এই শৃঙ্খলে সামান্য উন্নতিও একটি সিস্টেমকে অনেক বেশি কার্যকর করে তুলতে পারে, কারণ এতে ক্রমাগত মানব তত্ত্বাবধান এবং আগেভাগে প্রোগ্রাম করা ব্যতিক্রমী পরিস্থিতির প্রয়োজন কমে যায়।
অভিযোজন ক্ষমতাও একইভাবে ব্যবহারিক। যে রোবট কেবল খুব যত্নে প্রস্তুত করা পরিবেশে কাজ করে, তার অর্থনৈতিক পরিসর সীমিত। যে রোবট বিন্যাস, আলো, বাধা বা নির্দেশের ভিন্নতার সঙ্গে মানিয়ে নিতে পারে, সে আরও চাহিদাপূর্ণ শিল্প ও ফিল্ড ডেপ্লয়মেন্টে যেতে পারে। এই কারণেই এখানে বর্ণিত জুটি উল্লেখযোগ্য। Boston Dynamics নিয়ে আসে হার্ডওয়্যার, চলাচল, এবং ডেপ্লয়মেন্টের অভিজ্ঞতা। Gemini-কে এমন একটি স্তর হিসেবে স্থাপন করা হচ্ছে, যা ব্যাখ্যা ও সিদ্ধান্ত-গ্রহণ উন্নত করতে পারে।
ঘোষণায় AIVI-Learning-এর গুরুত্ব আরও বড় একটি প্রবণতার দিকেও ইঙ্গিত করে। রোবোটিক্স কোম্পানিগুলো এখন এমন সিস্টেম চায়, যা শুধু কাজ চালাবে না, বরং শিখবে এবং সাধারণীকরণও করবে। প্রচলিত অটোমেশন এখনো শক্তিশালী, কিন্তু তা অনেক সময় অত্যন্ত যত্নসাপেক্ষ সেটআপের ওপর নির্ভরশীল। AI-সহায়তাপ্রাপ্ত পদ্ধতি সেটআপের সময় কমাতে এবং একটি পরিস্থিতি থেকে আরেকটিতে রোবটকে উপযোগী আচরণ বহন করতে সাহায্য করতে চায়। অন্তত সেটাই প্রতিশ্রুতি, আর শিল্প এখনও তা পুরোপুরি পূরণ করতে পারেনি।
কেন এই অংশীদারিত্ব ক্ষেত্রটির দিকের সঙ্গে মানানসই
রোবোটিক্স খাত এখন ভৌত সিস্টেম এবং বড় AI মডেলের মধ্যে আরও ঘনিষ্ঠ সমন্বয়ের দিকে এগোচ্ছে। এর আকর্ষণ বোঝা সহজ। ফাউন্ডেশন মডেল দেখিয়েছে যে তারা ভাষা, ছবি, এবং প্যাটার্ন শনাক্তকরণকে বড় পরিসরে সামলাতে পারে। অন্যদিকে, ভৌত রোবটদের এখনও সেই বিস্তৃত সক্ষমতাকে নির্ভরযোগ্য ক্রিয়ায় রূপান্তরের আরও ভালো উপায় দরকার। দুটিকে একসঙ্গে আনা একটি স্পষ্ট পরবর্তী পদক্ষেপ, যদিও বোঝা এবং বাস্তবায়নের মধ্যে প্রযুক্তিগত ফাঁক এখনও অনেক বড়।
Boston Dynamics শূন্য থেকে শুরু করছে না। এর রোবটগুলো ইতিমধ্যেই সক্ষম চলাচল এবং পরিশীলিত স্বায়ত্তশাসনের প্রদর্শনের জন্য পরিচিত। কিন্তু শুধু গতিশীলতা দিয়ে কোনো মেশিনকে সাধারণ-উদ্দেশ্যসম্পন্ন করা যায় না। কার্যকর স্বায়ত্তশাসনের জন্য লক্ষ্য, প্রসঙ্গ, এবং ব্যতিক্রম সম্পর্কে বিচারক্ষমতা দরকার। তাই রিজনিং ও অভিযোজন ক্ষমতা উন্নত করার দাবিযুক্ত কোনো মডেল, যদি তা বাস্তব পরিচালনাগত সীমাবদ্ধতার মধ্যে ভালো কাজ করে, তাহলে তার প্রভাব হতে পারে অত্যন্ত বড়।
তবে সীমাবদ্ধতার দিকটি উপেক্ষা করা যাবে না। ভৌত সিস্টেমের ক্ষেত্রে এমন দৃঢ়তা দরকার, যা অনেক সময় সফটওয়্যার পণ্যে লাগে না। একটি চ্যাটবটের অস্বস্তিকর উত্তর মাফ করা যায়। কিন্তু মানুষ, যন্ত্রপাতি, বা অসম মাটির আশপাশে কাজ করা একটি রোবট কোনো পরিস্থিতি ভুল পড়লে সহজে ক্ষমা পাওয়া যায় না। তাই AI-চালিত রোবোটিক্সের প্রতিটি অগ্রগতি কেবল নতুনত্ব দিয়ে নয়, বরং স্থিতিশীলতা, নিরাপত্তা, এবং কিছু ভুল হলে পুনরুদ্ধারের ক্ষমতা দিয়েও বিচার করতে হবে।
পরের ধাপে কী দেখার আছে
এখন মূল প্রশ্নটি আর এই নয় যে AI মডেল রোবটের সঙ্গে যুক্ত হবে কি না। সেটা ইতিমধ্যেই শিল্পজুড়ে ঘটছে। আসল প্রশ্ন হলো, এই একীকরণ কতটা বাস্তব সক্ষমতা যোগ করে। Boston Dynamics বলছে, Gemini AIVI-Learning-এর মাধ্যমে Spot-এর রিজনিং এবং অভিযোজন ক্ষমতা উন্নত করবে। পরবর্তী প্রমাণ হবে, এই উন্নতি কি ডেমোর বাইরে এমন কাজে দেখা যায় যেগুলো সত্যিই গুরুত্বপূর্ণ: পরিদর্শন, নেভিগেশন, অপারেটরের সঙ্গে মিথস্ক্রিয়া, এবং পরিবর্তনশীল পরিবেশে কাজ করা।
যদি তা হয়, তবে এই ঘোষণা রোবোটিক্সের একটি বৃহত্তর মোড়ের অংশ বলে মনে হবে। যদি না হয়, তবুও এটি দেখাবে যে শিল্পে এই উপলব্ধি দৃঢ় হচ্ছে: ভালো উপলব্ধি এবং ভালো ভাষা একা যথেষ্ট নয়। রোবটদের লুপের মধ্যে আরও শক্তিশালী সিদ্ধান্ত-গ্রহণ দরকার। যাই হোক, Gemini বেছে নেওয়া দেখিয়ে দিচ্ছে প্রতিযোগিতার চাপ কোন দিকে তৈরি হচ্ছে: শুধু চমৎকারভাবে চলতে পারে এমন মেশিন বানানো নয়, বরং এমন মেশিন বানানো, যা আরও কার্যকরভাবে নির্ধারণ করতে পারে আসলে কোন ধরনের গতি দরকার।
এটাই সেই কঠিন মধ্যভূমি, যেখানে আধুনিক রোবোটিক্স সম্ভবত জিতবে বা হারবে। হার্ডওয়্যারের সক্ষমতা একটি রোবটকে ঘরের ভেতরে আনে। রিজনিং এবং অভিযোজন ক্ষমতা নির্ধারণ করে, সেখানে পৌঁছানোর পর সেটি কিছু মূল্যবান কাজ করতে পারবে কি না।
এই নিবন্ধটি The Robot Report-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.

