एक नया डेटा आपूर्तिकर्ता इस दाँव पर लगा है कि गेम वर्ल्ड्स वास्तविक दुनिया के लिए मशीन इंटेलिजेंस को प्रशिक्षित कर सकते हैं

Origin Lab ने AI labs और तथाकथित world models विकसित करने वाले गेम कंपनियों को जोड़ने वाला एक बाज़ार बनाने के लिए 8 मिलियन डॉलर का सीड राउंड जुटाया है। विचार सरल लेकिन संभावित रूप से महत्वपूर्ण है: जैसे-जैसे AI प्रणालियाँ टेक्स्ट से आगे बढ़कर रोबोटिक्स, सिमुलेशन और भौतिक तर्क की ओर जा रही हैं, उन्हें ऐसे प्रशिक्षण डेटा की ज़रूरत है जो वस्तुओं, स्थानों और गति के व्यवहार को कैप्चर करे। Origin Lab का तर्क है कि ऐसा बहुत-सा संरचित डेटा पहले से ही वीडियो गेम उद्योग के भीतर मौजूद है।

इस राउंड का नेतृत्व Lightspeed Ventures ने किया, जिसमें SV Angel, Eniac, Seven Stars और FPV ने भाग लिया, साथ ही Twitch के सह-संस्थापक Kevin Lin और Cruise के संस्थापक Kyle Vogt का एंजेल समर्थन भी शामिल रहा। निवेशकों की यह सूची मायने रखती है क्योंकि इससे लगता है कि कंपनी को केवल एक निच कंटेंट लाइसेंसिंग व्यवसाय नहीं, बल्कि उभरती AI आपूर्ति श्रृंखला के लिए अवसंरचना के रूप में देखा जा रहा है।

World-model निर्माताओं को अलग प्रकार के डेटा की ज़रूरत क्यों है

बड़े भाषा मॉडल प्रचुर इंटरनेट पाठ पर बनाए गए थे। भौतिक वातावरण के बारे में तर्क करने के लिए बने प्रणालियों के पास वैसा सहज डेटा भंडार नहीं है। Origin Lab की सह-संस्थापक Anne-Margot Rodde के अनुसार, अब बन रही AI प्रणालियों को यह समझने की ज़रूरत है कि भौतिक दुनिया कैसे काम करती है और चीज़ें कैसे चलती हैं। इससे उच्च-गुणवत्ता, अधिकार-साफ़ डेटा की एक बाधा बनती है, जो भाषा-पूर्णता के बजाय स्थानिक तर्क के लिए उपयोगी हो।

वीडियो गेम एक आकर्षक स्रोत हैं क्योंकि उनमें डिजिटल वातावरण, वस्तुएँ, अंतःक्रियाएँ और गति-रूप होते हैं, जिन्हें model-ready प्रारूपों में रेंडर, रिकॉर्ड या रूपांतरित किया जा सकता है। Origin Lab की व्याख्या में, यह उद्योग मूल्यवान एसेट्स पर बैठा है, लेकिन उन्हें AI labs को कुशलतापूर्वक पैकेज और लाइसेंस करने के लिए अवसंरचना नहीं रखता। स्टार्टअप का कहना है कि वह वही पुल बनेगा, मौजूदा गेम एसेट्स को प्रशिक्षण डेटा में बदल देगा, जिसमें rendered scenes से लेकर automated gameplay फुटेज तक शामिल हो सकते हैं।

व्यवसाय मॉडल लाइसेंसिंग और डेटा गुणवत्ता पर निर्भर करता है

यह विचार पूरी तरह नया नहीं है। AI labs लंबे समय से गेम फुटेज और गेम-जैसे सिमुलेशन वातावरण में रुचि रखते हैं। जो चीज़ गायब रही है, वह एक मज़बूत व्यावसायिक परत है जो कानूनी पहुँच और उपयोगिता, दोनों समस्याओं को एक साथ हल कर सके। स्रोत पाठ बताता है कि लाइसेंसिंग और डेटा-गुणवत्ता संबंधी मुद्दों ने अक्सर व्यापक उपयोग को रोका है। यहीं Origin Lab खुद को अलग दिखाने की कोशिश कर रहा है।

AI labs के लिए, लाइसेंस प्राप्त इनपुट scraped या अनौपचारिक स्रोतों से आने वाले डेटा से जुड़ी कानूनी अस्पष्टता को कम करते हैं। गेम कंपनियों के लिए, यह मॉडल पहले से बनाए गए डिजिटल एसेट्स से नई आय का स्रोत खोलता है। यदि प्लेटफ़ॉर्म काम करता है, तो यह कंटेंट को, जिसे अब तक बिक्री और engagement से मुद्रीकृत किया जाता था, model training के लिए द्वितीयक बाज़ार में बदल सकता है।

यही कारण है कि कंपनी का समय भी महत्वपूर्ण है। लेख में उल्लेख है कि 2024 के अंत में OpenAI को आलोचना का सामना करना पड़ा जब Sora के शुरुआती संस्करण ने वीडियो गेम और streamer फुटेज को पुन: प्रस्तुत किया, जिससे संकेत मिला कि प्रशिक्षण डेटा की उत्पत्ति व्यावसायिक और प्रतिष्ठात्मक रूप से संवेदनशील होती जा रही थी। Origin Lab मूलतः एक साफ़ रास्ता दे रहा है: अधिकार प्राप्त करें, डेटा को मानकीकृत करें, और उसे उन labs को बेचें जो विश्वसनीय आपूर्ति के लिए भुगतान कर सकते हैं।

डेटा विक्रेता अब रणनीतिक अवसंरचना बन रहे हैं

Lightspeed पार्टनर Faraz Fatemi ने अवसर को उन व्यवसायों के संदर्भ में रखा जो पहले से AI-संबंधित क्षेत्रों में परिचित हैं: प्रमुख labs के पास पर्याप्त पूंजी है, और डेटा एक bottleneck बना हुआ है। यह उस विकास-कथा से मेल खाता है जो निवेशक evaluation, labeling या data operations देने वाली कंपनियों में देख चुके हैं। Origin Lab का दाँव है कि world-model विकास एक समान supplier श्रेणी बनाएगा, जो simulation-grade और motion-rich datasets पर केंद्रित होगी।

इस बदलाव का महत्व केवल एक स्टार्टअप तक सीमित नहीं है। यह संकेत देता है कि AI अर्थव्यवस्था एक ऐसे चरण में प्रवेश कर रही है जहाँ proprietary या structured datasets, model architectures जितने ही रणनीतिक रूप से मूल्यवान हो सकते हैं। ऐसे माहौल में, जो कंपनियाँ दुर्लभ डेटा को स्रोत, वैध और संचालन योग्य बना सकती हैं, वे frontier models बनाए बिना भी शक्तिशाली मध्यस्थ बन सकती हैं।

यह अगली AI लड़ाई के बारे में क्या कहता है

Origin Lab का प्रस्ताव AI प्राथमिकताओं में एक व्यापक संक्रमण को दर्शाता है। सवाल अब केवल टेक्स्ट जनरेशन को स्केल करने का नहीं है। अब यह सिस्टम बनाने का है जो वातावरण को महसूस कर सकें, वस्तुओं के बारे में तर्क कर सकें और अंततः भौतिक दुनिया के साथ अंतःक्रिया कर सकें। इससे बाज़ार नए प्रकार के डेटा और उसे खोलने वाली कंपनियों की ओर मुड़ता है।

क्या गेम एसेट्स world models के लिए एक आधारभूत इनपुट बनेंगे, यह अभी सिद्ध होना बाकी है। synthetic environments उपयोगी हैं, लेकिन वे वास्तविक दुनिया के बराबर नहीं हैं, और labs को अभी भी यह तय करना होगा कि game-derived डेटा व्यावहारिक रोबोटिक्स या embodied intelligence अनुप्रयोगों में कितना अच्छी तरह स्थानांतरित होता है। फिर भी, स्टार्टअप एक वास्तविक बाधा को लक्ष्य कर रहा है। यदि world-model शोध तेज़ होता है, तो legally sourced और technically adaptable datasets की माँग भी बढ़ने की संभावना है।

इससे Origin Lab केवल एक संकीर्ण licensing play से अधिक बन जाता है। यह एक शुरुआती संकेत है कि AI supply chain कितनी विशिष्ट होती जा रही है। उद्योग के अगले चरण में, महत्वपूर्ण कंपनियाँ केवल मॉडल प्रशिक्षण करने वाली नहीं होंगी। वे यह तय करने वाली भी हो सकती हैं कि मॉडल क्या देख सकते हैं।

यह लेख TechCrunch की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on techcrunch.com