একটি স্টার্টআপ রোবট প্রশিক্ষণকে শিল্পায়িত করছে

Tutor Intelligence রোবোটিক্সের ভবিষ্যৎ নিয়ে একটি অস্বাভাবিকভাবে সরাসরি যুক্তি দিচ্ছে: বাধা শুধু আরও ভালো মডেল নয়, বরং বাস্তব দুনিয়ায় কাজ করা রোবট থেকে সংগৃহীত আরও ভালো ডেটা। সেই সমস্যাকে মোকাবিলা করতে কোম্পানি DF1 নামে ১০০টি দ্বিহস্ত ম্যানিপুলেটর নিয়ে একটি “Data Factory” তৈরি করেছে, যাকে তারা শারীরিক AI-এর জন্য এক ধরনের কিন্ডারগার্টেন বলে বর্ণনা করে।

ধারণাগতভাবে এটি সহজ, কিন্তু বাস্তবায়নে উচ্চাকাঙ্ক্ষী। প্রধানত সিমুলেশনের ওপর নির্ভর না করে Tutor তার Ti0 vision-language-action মডেলকে প্রশিক্ষণ দিতে বাস্তব রোবট, মানব teleoperator, এবং পুনরাবৃত্ত কাজ ব্যবহার করছে। কোম্পানির দাবি, এই কাঠামো এমন একটি grounded, scalable learning pipeline তৈরি করতে পারে, যা রোবোটিক্সের হাতে বড় ভাষা মডেলের মতো ডেটা প্রাচুর্য কখনও ছিল না বলে ঘাটতি পূরণ করতে পারে।

Tutor-এর পিচে এই তুলনাটাই কেন্দ্রীয়। সহ-প্রতিষ্ঠাতা ও সিইও জশ গ্রুনস্টিন যেমন বলেছেন, রোবোটিক্সের জন্য Wikipedia-র মতো কোনও সমতুল্য নেই। ইন্টারনেটে থাকা মানবজ্ঞান ভাষা মডেলকে শেখার জন্য বিশাল corpus দিয়েছে। রোবটদের দরকার আলাদা কিছু: শারীরিক প্রদর্শন, সংশোধনমূলক প্রতিক্রিয়া, এবং বাস্তব বস্তু ও পরিবেশের জটিলতার সঙ্গে বারবার মুখোমুখি হওয়া।

বাস্তব দুনিয়ার ডেটা কৌশলগতভাবে কেন আকর্ষণীয়

Tutor-এর DF1 উদ্যোগ রোবোটিক্সে চলতে থাকা একটি বৃহত্তর বিতর্কের প্রতিফলন। সিমুলেশন এখনো মূল্যবান, কারণ এটি সস্তা, দ্রুত, এবং নিরাপদ। কিন্তু সিমুলেশন থেকে বাস্তবে আচরণ স্থানান্তর করতে গেলে প্রায়ই আসল ভৌত পারস্পরিক ক্রিয়ার জটিল কঠিন বাস্তবতার মুখোমুখি হতে হয়। বস্তু বিকৃত হয়, পিছলে যায়, আলোর প্রতিফলন অপ্রত্যাশিত হয়, আর জটলা-ভরা পরিবেশে সেগুলো দেখা যায়, যা ভার্চুয়াল পরিবেশ পুরোপুরি ধরতে পারে না।

১০০টি রোবটকে এক প্রশিক্ষণ পরিবেশে রেখে এবং e-commerce ও kitting-এ প্রচলিত piece-picking কাজ করিয়ে Tutor সেই জায়গাতেই ডেটা সংগ্রহ করতে চাইছে, যেখানে প্রকৃত সমস্যা দেখা দেয়। কোম্পানির দাবি, শুরুতে রোবটগুলো ছিল বেশ অমসৃণ, কিন্তু মেক্সিকো ও ফিলিপাইনের ৪৫ থেকে ৫০ জন দূরবর্তী “tutors” teleoperation সিস্টেমের মাধ্যমে কয়েক সপ্তাহের মধ্যে উন্নতি করেছে।

যদি এই অগ্রগতি পুনরাবৃত্তিযোগ্য হয়, তাহলে তার তাৎপর্য বড়। রোবোটিক্স আধুনিক AI-এর সবচেয়ে গভীর সুবিধাগুলোর একটি ধার নিতে শুরু করতে পারে: বড় আকারে দ্রুত পুনরাবৃত্তি। ইন্টারনেটের টেক্সট দিয়ে নয়, বরং যন্ত্রের বহর জুড়ে ছড়ানো structured human teaching-এর মাধ্যমে।

বাণিজ্যিক deployment-ও প্রশিক্ষণ চক্রের অংশ

Tutor DF1-কে শুধু ল্যাবরেটরির কৌতূহল হিসেবে দেখাচ্ছে না। তারা এই সিস্টেমকে একটি “virtuous cycle”-এর প্রথম ধাপ হিসেবে ফ্রেম করছে, যেখানে বাণিজ্যিকভাবে deployed রোবট ভবিষ্যতের কর্মক্ষমতা উন্নত করতে প্রয়োজনীয় ডেটা উৎপাদন করে যাবে। এটি একটি গুরুত্বপূর্ণ কৌশলগত পার্থক্য। এই মডেলে deployment কেবল প্রযুক্তি থেকে আয় করার উপায় নয়। এটি প্রযুক্তিকে আরও এগিয়েও দেয়।

এই চক্র কাজ করলে তা খুব শক্তিশালী হতে পারে। রোবটের প্রতিটি বাস্তব কাজ edge cases, corrections, examples-এর উৎস হয়ে ওঠে, যা পরে আরও ভালো policies-এ ব্যবহার করা যায়। সময়ের সঙ্গে সঙ্গে বহরগুলো শুধু software update-এর মাধ্যমে নয়, শিল্পক্ষেত্রে ব্যবহৃত হয়ে জমা হওয়া operational memory দিয়েও উন্নত হতে পারে।

অবশ্য, এই পদ্ধতির জন্য উল্লেখযোগ্য অবকাঠামো প্রয়োজন। hardware, teleoperation শ্রম, cloud compute, এবং demonstrations-কে ব্যবহারযোগ্য training signals-এ রূপান্তর করার মতো workflow দরকার। Tutor এসব কিছুর মধ্যেই একসঙ্গে বিনিয়োগ করছে। কোম্পানি ২০২৫ সালের ডিসেম্বরে Series A funding-এ ৩৪ মিলিয়ন ডলার তুলেছে এবং Physical AI Fellowship ecosystem-এর অংশ হিসেবে AWS ও NVIDIA-এর সঙ্গে কাজ করেছে।

বড় প্রশ্ন হলো data factory কি মানক হয়ে উঠবে

Tutor দাবি করছে DF1 যুক্তরাষ্ট্রের সবচেয়ে বড় robotic data factory। এটা কতদিন সত্য থাকে বা না থাকে, তার চেয়েও বড় বিষয় হলো ধারণাটি। যদি general-purpose বা semi-general-purpose robotics শেষ পর্যন্ত model architecture-এর চেয়ে data quality দিয়ে বেশি সীমাবদ্ধ হয়, তাহলে mass robot teaching-এর জন্য বিশেষভাবে বানানো প্রতিষ্ঠানগুলো শিল্পের মানক অংশ হয়ে উঠতে পারে।

এতে robotics মূলত hardware engineering থেকে hardware-সংযুক্ত data operations business-এ রূপান্তরিত হবে। সেই জগতে জয়ী হতে পারে সেই কোম্পানিগুলো, যারা মানব নির্দেশনা, বহর deployment, এবং model improvement-এর মধ্যে feedback loop সবচেয়ে ভালোভাবে সংগঠিত করতে পারে।

piece-picking দিয়ে শুরু করার Tutor-এর সিদ্ধান্তটিও তাৎপর্যপূর্ণ। এটি বাণিজ্যিকভাবে প্রাসঙ্গিক, এতটাই পুনরাবৃত্তিমূলক যে অনেক উদাহরণ তৈরি করা যায়, এবং শারীরিকভাবে এত বৈচিত্র্যময় যে manipulation পরীক্ষার জন্য উপযুক্ত। এই বৈশিষ্ট্যগুলিই একটি কাজকে business application এবং training substrate, দুটো হিসেবেই কার্যকর করে তোলে।

Physical AI-কে এখনও প্রমাণ দরকার, কিন্তু তত্ত্বটি সঙ্গতিপূর্ণ

Tutor Intelligence এখনও প্রমাণ করেনি যে তাদের data-factory পদ্ধতি সার্বিকভাবে সক্ষম robot intelligence দেবে। সেটি warehouse-style কাজের দ্রুত উন্নতি দেখানোর চেয়েও বড় দাবি। তবু কোম্পানির মূল ধারণা বাতিল করা কঠিন। রোবট শুধু এমন এক বিশ্ব সম্পর্কে মানব ভাষা থেকে শিখতে পারে না, যাকে তারা কখনও স্পর্শই করেনি। কোনও একসময়, কাউকে তাদেরকে physical reality-তেই শেখাতেই হবে।

DF1 সেই শিক্ষণ প্রক্রিয়াকে স্কেল করার একটি প্রচেষ্টা। ছড়িয়ে-ছিটিয়ে থাকা deployment থেকে রোবটদের ঘটনাক্রমে শেখার অপেক্ষা না করে Tutor এমন একটি পরিবেশ তৈরি করছে, যা instruction-কে একটি সম্পদ হিসেবে উৎপাদন করে। যদি কোম্পানি সেই সম্পদকে আরও অভিযোজ্য আচরণে রূপান্তর করতে পারে, তাহলে simulation-first পদ্ধতির চেয়ে physical AI-র জন্য আরও বাস্তবসম্মত পথ নির্ধারণে সাহায্য করতে পারে।

এখন Tutor-এর গুরুত্ব একটি চূড়ান্ত উত্তর দেওয়ার চেয়ে, robot data collection-কে একটি শিল্পসমস্যা হিসেবে দেখে তার জন্য আলাদা অবকাঠামোকে ন্যায্যতা দেওয়াতেই বেশি। প্রভাবশালী demo থেকে নির্ভরযোগ্য utility-তে দ্রুততম পথ খুঁজতে থাকা একটি ক্ষেত্রে এটি একটি গুরুতর ধারণা।

এই নিবন্ধটি The Robot Report-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.

Originally published on therobotreport.com