ভৌত এআই-এর পরবর্তী স্তর নিয়ে একটি স্পনসরকৃত যুক্তি

IEEE Spectrum-এ প্রকাশিত এবং Wetour Robotics-এর নামে উল্লেখিত একটি স্পনসরকৃত নিবন্ধ ভৌত এআই-এর ভবিষ্যৎ সম্পর্কে একটি নির্দিষ্ট দাবি করে: অগ্রগতি আসবে কম পরিমাণে রোবটকে স্বাধীনভাবে আরও বুদ্ধিমান করার মাধ্যমে, এবং বেশি পরিমাণে মানুষ ও যন্ত্রের মধ্যে সংযোগকারী ইন্টারফেস উন্নত করার মাধ্যমে। প্রচারণামূলক প্রেক্ষাপটকে বিবেচনায় নিলেও, এই framing উল্লেখযোগ্য, কারণ এটি রোবোটিক্স এবং embodied AI উন্নয়নের ভেতরের একটি বাস্তব টানাপোড়েনকে ধরতে পারে।

বছরের পর বছর ধরে, এআই-এর প্রাধান্যশীল গল্পটি autonomy-কে ঘিরে ছিল। উন্নততর মডেল, আরও সক্ষম reasoning, শক্তিশালী perception, এবং সমৃদ্ধ action planning এই ক্ষেত্রকে এমন সিস্টেমের দিকে ঠেলে দিয়েছে যা কম মানব ইনপুটে বেশি কাজ করতে পারে। Wetour Robotics ভিন্ন একটি অগ্রাধিকার নিয়ে যুক্তি দিচ্ছে। তাদের ভাষ্যে, পরবর্তী architectural leap মানুষের ভূমিকা লুপ থেকে সরিয়ে দেওয়া নয়; বরং মানুষকে লুপের ভেতরে low-latency, high-fidelity অংশগ্রহণ দেওয়া।

মানুষ একটি first-class node হিসেবে

প্রদত্ত উৎস-পাঠ্যে কোম্পানিটিকে Austin, Texas-ভিত্তিক একটি physical AI infrastructure এবং wearable robotics ব্যবসা হিসেবে বর্ণনা করা হয়েছে। বলা হয়েছে Wetour-এর ধারণা হলো বড় অগ্রগতি আসবে মানুষকে “computing network-এ একটি first-class node” হিসেবে বিবেচনা করার মধ্য দিয়ে, যার connectivity অন্যান্য ডিভাইসের সমান। এই বাক্যটি গুরুত্বপূর্ণ, কারণ এটি interface-কে একটি সাধারণ control mechanism থেকে সরিয়ে system architecture-এরই অংশে পরিণত করে।

প্রায়োগিকভাবে, এটি এমন এক মডেলের ইঙ্গিত দেয় যেখানে কর্মী, টেকনিশিয়ান বা অপারেটররা বাহ্যিক তত্ত্বাবধায়ক নন যারা মাঝে মাঝে নির্দেশ দেন, বরং ঘনিষ্ঠভাবে সংযুক্ত অংশগ্রহণকারী, যাদের intent, context, বা physical state আরও সরাসরি machine action-এ রূপান্তর করা যায়। নিবন্ধটি একটি wind turbine-এ থাকা field technician-এর উদাহরণ দিয়ে শুরু হয়, যিনি দুই হাতই ব্যস্ত থাকা সত্ত্বেও diagnostic device-এর সঙ্গে যোগাযোগ করতে চান। এখানে যে সমস্যাটি তুলে ধরা হয়েছে তা ডিভাইসের বুদ্ধিমত্তার অভাব নয়। এটি interface-এ friction।

এটি একটি কার্যকর পার্থক্য। বাস্তব জগতে অনেক রোবোটিক্স deployment ব্যর্থ হয় না কারণ যন্ত্রের কোনো abstract ক্ষমতা নেই, বরং কারণ interaction cumbersome, delayed, অথবা পরিবেশের সঙ্গে ঠিকমতো মানানসই নয়। warehouses, field maintenance sites, factories, এবং infrastructure assets-এর মতো জায়গায় অপারেটরদের এমন পরিবেশে কাজ করতে হয় যেখানে screens, keyboards, এবং touch gestures অস্বস্তিকর বা অনিরাপদ হতে পারে।

কেন interface design bottleneck হয়ে উঠতে পারে

যদি embodied AI systems দ্রুত উন্নত হয়, তাহলে কিছু ক্ষেত্রে model quality-এর চেয়ে interface quality বড় bottleneck হয়ে উঠতে পারে। একটি robot বা diagnostic system যা পৃথিবীকে বুঝতে পারে, কিন্তু কার্যকর মানব নির্দেশনা গ্রহণ করতে পারে না, সেটি তবুও ধীর, ত্রুটিপূর্ণ, অথবা বিশ্বাসযোগ্যতা হারাতে পারে। বিপরীতে, সীমিত autonomy থাকলেও চমৎকার মানব coupling-সহ একটি system safety-critical বা জটিল physical environment-এ আরও ভালো ফল দিতে পারে।

Wetour যে যুক্তি উপস্থাপন করতে চাইছে বলে মনে হয়, তার সবচেয়ে শক্তিশালী রূপ এটিই। ভৌত এআই-এর মূল্য কেবল এই নয় যে যন্ত্র কী infer করতে পারে, বরং মানুষ সঠিক মুহূর্তে judgment, intent, এবং correction কতটা কার্যকরভাবে দিতে পারে। এটি বিশেষভাবে প্রাসঙ্গিক এমন কাজে, যেখানে expertise software rules-এ সহজে নামিয়ে আনা যায় না, বরং embodied এবং situational।

নিবন্ধটির স্পনসরকৃত প্রকৃতিটিও গুরুত্বপূর্ণ। Wetour-এর wearable robotics এবং neural বা advanced interface concepts প্রচারের সরাসরি বাণিজ্যিক স্বার্থ রয়েছে। তাই পাঠকদের এই নিবন্ধকে নিরপেক্ষ সাংবাদিকতা হিসেবে নয়, বরং নিজের product category ঘিরে আলোচনাকে প্রভাবিত করার চেষ্টা করা একটি কোম্পানির strategic direction-এর বিবৃতি হিসেবে দেখা উচিত। তবু, এতে underlying thesis তুচ্ছ হয়ে যায় না। শিল্পের ইতিহাস এমন মুহূর্তে ভরা, যখন interface improvements বিদ্যমান compute বা sensing capabilities-এর মূল্য উন্মোচন করেছে।

পূর্ণ autonomy-এর চেয়ে ভৌত এআই বেশি বিস্তৃত

নিবন্ধের একটি implication হলো ভৌত এআই sector একটি আরও plural phase-এ প্রবেশ করতে পারে। প্রতিটি লাভ পূর্ণ autonomy থেকেই আসবে ধরে না নিয়ে, কোম্পানিগুলো mixed models অনুসরণ করতে পারে যেখানে মানব cognition এবং machine assistance আরও tightly fused। এর মধ্যে wearables, adaptive controls, real-time intent recognition, এবং demanding environment-এ command-এর খরচ কমানোর জন্য তৈরি systems থাকতে পারে।

যেসব ক্ষেত্রে নিয়ন্ত্রক, safety, বা operational constraints-এর কারণে পূর্ণ robot independence বাস্তবায়ন কঠিন, সেখানে এই পদ্ধতি বিশেষভাবে আকর্ষণীয় হতে পারে। field service, industrial inspection, energy infrastructure, এবং maintenance work-এ physically complex এবং context-rich কাজ থাকে। ওই পরিবেশে interface দ্রুততর এবং আরও intuitive করা, robot-এর decision-making উন্নত করার মতোই অর্থনৈতিকভাবে গুরুত্বপূর্ণ হতে পারে।

কোম্পানির এই formulation-ও একটি প্রচলিত ধারণার বিরুদ্ধে যায়, যেখানে বেশি স্মার্ট রোবট স্বয়ংক্রিয়ভাবে মানুষকে সরিয়ে দেবে। বরং আরও interface-driven model ধারাবাহিক মানব-কেন্দ্রিকতাকে ধরে নেয়, যেখানে AI action বাড়ায়, সম্পূর্ণভাবে প্রতিস্থাপন করে না। এটি transitional stage নাকি দীর্ঘস্থায়ী architecture, তা নির্ভর করবে সময়ের সঙ্গে autonomous systems কতটা সক্ষম হয় তার ওপর।

মার্কেটিং মোড়ক সত্ত্বেও একটি কার্যকর শিল্প সংকেত

কারণ উৎসটি স্পনসরকৃত এবং কেবল একটি ছোট excerpt দেওয়া হয়েছে, এখানে উত্থাপিত দাবিগুলো সতর্কভাবে এবং সীমিত পরিসরে দেখা উচিত। নিশ্চিতভাবে বলা যায়, Wetour Robotics প্রকাশ্যে নিজেদের পরিচয় physical AI-এর এমন এক দৃষ্টিভঙ্গির ওপর স্থাপন করছে, যা interfaces এবং human participation-কে কেন্দ্রে রাখে। সেই অবস্থান নিজেই সংবাদযোগ্য, কারণ এটি রোবোটিক্সের চলমান বিতর্কগুলোর একটিকে প্রতিফলিত করে: পরবর্তী বাস্তব লাভগুলো কোথা থেকে আসবে।

যদি সাম্প্রতিক এআই চক্রগুলো আরও ভালো brains তৈরির প্রতিযোগিতায় আধিপত্য বিস্তার করে থাকে, তাহলে physical deployment-এর পরবর্তী ধাপে সেই brains এবং তাদের পাশে কাজ করা মানুষদের মধ্যে আরও ভালো connective tissue প্রয়োজন হতে পারে। Wetour-এর নিবন্ধটি একটি commercial pitch, কিন্তু এটি শিল্পের জন্য একটি ক্রমেই গুরুত্বপূর্ণ design question-ও নির্দেশ করে। ভৌত এআই-তে সবচেয়ে স্মার্ট systemটি সেই নাও হতে পারে, যেখানে মানব অংশগ্রহণ সবচেয়ে কম। সেটি হতে পারে এমন system, যা মানব অংশগ্রহণকে অনেক বেশি শক্তিশালী করে তোলে।

এই নিবন্ধটি IEEE Spectrum-এর প্রতিবেদনের উপর ভিত্তি করে। মূল নিবন্ধটি পড়ুন.

Originally published on spectrum.ieee.org