একজন নতুন data supplier এই বাজি ধরছে যে game worlds বাস্তব বিশ্বের জন্য machine intelligence প্রশিক্ষণ দিতে পারে

Origin Lab AI labs এবং so-called world models উন্নয়নকারী ভিডিও গেম কোম্পানিগুলোকে সংযুক্ত করার জন্য একটি marketplace তৈরি করতে ৮ মিলিয়ন ডলারের seed round তুলেছে। ধারণাটি সহজ, কিন্তু সম্ভাবনাময়: AI systems যখন text-এর বাইরে গিয়ে robotics, simulation, এবং physical reasoning-এর দিকে এগোচ্ছে, তখন তাদের এমন training data দরকার যা objects, spaces, এবং motion কীভাবে কাজ করে তা ধরে রাখতে পারে। Origin Lab-এর যুক্তি হলো, এই ধরনের কাঠামোবদ্ধ data-এর বড় একটি অংশ ইতিমধ্যেই video game industry-র ভেতরেই আছে।

এই round-এর নেতৃত্ব দিয়েছে Lightspeed Ventures, সঙ্গে অংশ নিয়েছে SV Angel, Eniac, Seven Stars, এবং FPV, পাশাপাশি Twitch co-founder Kevin Lin এবং Cruise founder Kyle Vogt-এর angel backing। এই investor list গুরুত্বপূর্ণ, কারণ এটি ইঙ্গিত করে কোম্পানিটিকে কেবল একটি niche content licensing business নয়, বরং দ্রুত বাড়তে থাকা AI supply chain-এর infrastructure হিসেবেও দেখা হচ্ছে।

world-model নির্মাতাদের কেন ভিন্ন ধরনের data দরকার

Large language models বিপুল internet text-এর ওপর তৈরি হয়েছে। physical environments নিয়ে reasoning করার জন্য তৈরি systems-এর কাছে এমন সহজ data reservoir নেই। Origin Lab-এর co-founder Anne-Margot Rodde-এর মতে, এখন তৈরি হওয়া AI systems-কে বুঝতে হবে physical world কীভাবে কাজ করে এবং বস্তুগুলো কীভাবে নড়াচড়া করে। ফলে language completion-এর বদলে spatial reasoning-এর জন্য দরকার high-quality, rights-cleared data, আর সেটিই bottleneck তৈরি করছে।

ভিডিও গেম একটি আকর্ষণীয় উৎস, কারণ এতে digital environments, objects, interactions, এবং motion patterns থাকে, যেগুলো render করা, record করা, বা model-ready formats-এ রূপান্তর করা যায়। Origin Lab-এর ব্যাখ্যায়, শিল্পটি মূল্যবান assets-এর ওপর বসে আছে, কিন্তু সেগুলোকে AI labs-এর কাছে দক্ষতার সঙ্গে package ও license করার infrastructure নেই। startup বলছে, তারা সেই সেতুর কাজ করবে, existing game assets-কে training data-তে রূপান্তর করবে, যার পরিসর rendered scenes থেকে automated gameplay footage পর্যন্ত হতে পারে।

ব্যবসায়িক যুক্তি licensing এবং data quality-এর ওপর নির্ভরশীল

এই ধারণা পুরোপুরি নতুন নয়। AI labs বহুদিন ধরেই game footage এবং game-like simulation environments-এ আগ্রহী। যা অনুপস্থিত ছিল, তা হলো এমন শক্তিশালী commercial layer, যা একসঙ্গে legal access এবং usability সমস্যা সমাধান করতে পারে। source text অনুযায়ী, licensing এবং data-quality সমস্যা প্রায়ই বিস্তৃত ব্যবহারকে বাধা দিয়েছে। এখানেই Origin Lab নিজেকে আলাদা করতে চাইছে।

AI labs-এর জন্য licensed inputs scraped বা informally sourced data-র চারপাশে থাকা legal ambiguity কমায়। game companies-এর জন্য, এই model আগে থেকেই তৈরি digital assets থেকে নতুন revenue stream দেয়। platform কাজ করলে, এটি sales এবং engagement-এর মাধ্যমে monetized content-কে model training-এর জন্য secondary market-এ পরিণত করতে পারে।

এ কারণেই কোম্পানির timing গুরুত্বপূর্ণ। ২০২৪ সালের শেষদিকে Sora-এর একটি প্রাথমিক version ভিডিও game এবং streamer footage পুনরুত্পাদন করেছে বলে OpenAI সমালোচনার মুখে পড়ে, যা training data provenance ব্যবসায়িক এবং reputational উভয় দিক থেকেই সংবেদনশীল হয়ে উঠছে তা দেখায়। Origin Lab মূলত একটি পরিষ্কার পথ দিচ্ছে: rights নিন, data standardize করুন, এবং reliable supply-এর জন্য অর্থ দিতে সক্ষম labs-কে বিক্রি করুন।

Data vendors এখন strategic infrastructure হয়ে উঠছে

Lightspeed partner Faraz Fatemi সুযোগটিকে ইতিমধ্যেই পরিচিত AI-adjacent business গল্পের ভাষায় ব্যাখ্যা করেছেন: major labs যথেষ্ট capitalized, আর data এখনো bottleneck। এটি evaluation, labeling, বা data operations সরবরাহকারী কোম্পানিতে বিনিয়োগকারীরা যে growth story দেখেছেন, তারই প্রতিধ্বনি। Origin Lab-এর ধারণা হলো world-model development simulation-grade এবং motion-rich datasets-কেন্দ্রিক একটি সমজাতীয় supplier category তৈরি করবে।

এই পরিবর্তনের গুরুত্ব একটি startup-এর বাইরেও বিস্তৃত। এটি ইঙ্গিত দেয় যে AI economy এমন একটি পর্যায়ে প্রবেশ করছে, যেখানে proprietary বা structured datasets model architectures-এর মতোই কৌশলগতভাবে মূল্যবান হতে পারে। এমন পরিবেশে, যারা বিরল data source, legalize, এবং operationalize করতে পারে, তারা frontier models না বানিয়েও শক্তিশালী intermediary হয়ে উঠতে পারে।

পরবর্তী AI battleground সম্পর্কে এটি কী বলছে

Origin Lab-এর pitch AI priorities-এ একটি বিস্তৃত পরিবর্তন প্রতিফলিত করে। প্রশ্নটি আর শুধু text generation scale করার নয়। এখন প্রশ্ন হলো এমন systems তৈরি করা, যা environment perceive করতে পারে, objects সম্পর্কে reasoning করতে পারে, এবং শেষ পর্যন্ত physical world-এর সঙ্গে interact করতে পারে। এতে বাজার নতুন ধরনের data এবং তা খুলে দেওয়া ব্যবসাগুলোর দিকে ঘুরছে।

game assets world models-এর জন্য ভিত্তিমূলক input হয়ে উঠবে কি না, তা এখনও প্রমাণিত হয়নি। synthetic environments উপকারী, কিন্তু সেগুলো বাস্তব বিশ্বের সমান নয়, এবং game-derived data practical robotics বা embodied intelligence applications-এ কতটা ভালোভাবে স্থানান্তরিত হয় তা labs-কে এখনও নির্ধারণ করতে হবে। তবু startup একটি বাস্তব সীমাবদ্ধতাকে লক্ষ্য করছে। world-model research দ্রুত এগোলে, legally sourced এবং technically adaptable datasets-এর চাহিদাও বাড়তে পারে।

এতে Origin Lab কেবল একটি narrow licensing play-এর চেয়ে বেশি হয়ে ওঠে। এটি AI supply chain কতটা specialized হয়ে উঠছে তার একটি প্রাথমিক ইঙ্গিত। শিল্পের পরবর্তী ধাপে, গুরুত্বপূর্ণ কোম্পানিগুলো শুধু model training করবে না; তারা model-গুলো কী দেখতে পারবে তাও নির্ধারণ করবে।

এই নিবন্ধটি TechCrunch-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধটি পড়ুন.

Originally published on techcrunch.com