game worlds खऱ्या जगासाठी machine intelligence ला प्रशिक्षण देऊ शकतात, असा एक नवीन data supplier पैज लावत आहे

Origin Lab ने AI labs आणि so-called world models विकसित करणाऱ्या video game कंपन्यांना जोडणारे marketplace उभारण्यासाठी ८ दशलक्ष डॉलरचा seed round उभारला आहे. कल्पना सोपी आहे, पण महत्त्वाची ठरू शकते: AI systems text च्या पलीकडे जाऊन robotics, simulation, आणि physical reasoning कडे जात असताना, त्यांना objects, spaces, आणि motion कसे वागतात हे पकडणाऱ्या training data ची गरज असते. असा बराचसा structured data video game industry मध्ये आधीपासूनच उपलब्ध आहे, असा Origin Lab चा दावा आहे.

या round चे नेतृत्व Lightspeed Ventures ने केले, ज्यात SV Angel, Eniac, Seven Stars, आणि FPV यांनी सहभाग घेतला, तसेच Twitch co-founder Kevin Lin आणि Cruise founder Kyle Vogt यांच्याकडून angel backing मिळाले. ही investor यादी महत्त्वाची आहे, कारण कंपनीला केवळ niche content licensing business म्हणून नाही, तर वाढत्या AI supply chain साठी infrastructure म्हणूनही पाहिले जात असल्याचे ती सूचित करते.

world-model builders ना वेगळ्या प्रकारच्या data ची गरज का आहे

Large language models प्रचंड इंटरनेट मजकुरावर तयार झाले. physical environments बद्दल reasoning करणाऱ्या systems कडे असा सहज data reservoir नाही. Origin Lab ची सहसंस्थापक Anne-Margot Rodde यांच्या मते, सध्या तयार होत असलेल्या AI systems ला physical world कसे काम करते आणि वस्तू कशा हलतात हे समजणे आवश्यक आहे. त्यामुळे language completion ऐवजी spatial reasoning साठी उपयुक्त, rights-cleared उच्च दर्जाच्या data चा bottleneck निर्माण होतो.

Video games आकर्षक source आहेत कारण त्यात digital environments, objects, interactions, motion patterns असतात, ज्यांना render, record, किंवा model-ready formats मध्ये रूपांतरित करता येते. Origin Lab च्या मांडणीनुसार, उद्योग मौल्यवान assets वर बसलेला आहे, पण त्यांना AI labs कडे कार्यक्षमपणे package आणि license करण्यासाठी infrastructure नाही. startup म्हणते की तीच ती दुवा बनेल, existing game assets ला training data मध्ये रूपांतरित करेल, ज्यामध्ये rendered scenes पासून automated gameplay footage पर्यंतचा समावेश होऊ शकतो.

business case licensing आणि data quality वर अवलंबून आहे

ही कल्पना पूर्णपणे नवीन नाही. AI labs अनेक वर्षांपासून game footage आणि game-like simulation environments मध्ये रस दाखवत आहेत. जे गहाळ होते ते म्हणजे legal access आणि usability समस्या एकाच वेळी सोडवणारा मजबूत commercial layer. source text मध्ये नमूद केल्याप्रमाणे, licensing आणि data-quality समस्या अनेकदा व्यापक वापराला अडथळा आणत आल्या आहेत. तिथेच Origin Lab स्वतःला वेगळे सिद्ध करू पाहत आहे.

AI labs साठी, licensed inputs scraped किंवा informally sourced data भोवतीची legal ambiguity कमी करतात. game companies साठी, हे model आधी तयार केलेल्या digital assets मधून नवीन revenue stream देते. platform कार्यरत ठरल्यास, sales आणि engagement मधून monetized content ला model training साठी secondary market मध्ये रूपांतरित करता येऊ शकते.

म्हणूनच कंपनीची timing महत्त्वाची आहे. २०२४ च्या अखेरीस Sora च्या सुरुवातीच्या आवृत्तीने video game आणि streamer फुटेज पुन्हा तयार केल्यासारखे दिसल्याने OpenAI ला टीकेला सामोरे जावे लागले, ज्यातून training data provenance व्यावसायिक आणि प्रतिष्ठात्मक दोन्ही दृष्टीने संवेदनशील होत असल्याचे दिसले. Origin Lab स्वच्छ मार्ग देत आहे: rights मिळवा, data standardize करा, आणि reliable supply साठी पैसे देऊ शकणाऱ्या labs ना ते विकून टाका.

Data vendors आता strategic infrastructure होत आहेत

Lightspeed partner Faraz Fatemi यांनी संधीचे वर्णन AI-संबंधित इतर business कथांमध्ये परिचित असलेल्या भाषेत केले: major labs चांगल्या प्रकारे capitalized आहेत, आणि data हा अजूनही bottleneck आहे. हे evaluation, labeling, किंवा data operations पुरवणाऱ्या कंपन्यांमध्ये गुंतवणूकदारांनी पाहिलेल्या growth story चेच प्रतिबिंब आहे. Origin Lab ची पैज अशी आहे की world-model development simulation-grade आणि motion-rich datasets वर लक्ष केंद्रित करणारी समतुल्य supplier category निर्माण करेल.

या बदलाचे महत्त्व एका startup पुरते मर्यादित नाही. AI economy proprietary किंवा structured datasets, model architectures इतकेच धोरणात्मकदृष्ट्या मौल्यवान ठरू शकतात अशा टप्प्यात प्रवेश करत आहे, हे त्यातून सूचित होते. अशा वातावरणात, दुर्मीळ data source, legalize, आणि operationalize करू शकणाऱ्या कंपन्या frontier models न बनवता देखील प्रभावी intermediary बनू शकतात.

पुढील AI battle बद्दल हे काय सांगते

Origin Lab चे pitch AI priorities मधील व्यापक बदल प्रतिबिंबित करते. प्रश्न आता फक्त text generation scale करण्याचा नाही. आता असा systems तयार करण्याचा आहे जे वातावरण ओळखू शकतील, objects बद्दल reasoning करू शकतील, आणि शेवटी physical world शी interact करू शकतील. यामुळे बाजार नवीन प्रकारच्या data कडे आणि ते उघडणाऱ्या businesses कडे वळतो.

game assets world models साठी मूलभूत input बनतील का, हे अजून सिद्ध व्हायचे आहे. synthetic environments उपयुक्त आहेत, पण त्या वास्तविक जगासारख्या नाहीत, आणि game-derived data practical robotics किंवा embodied intelligence applications मध्ये किती चांगले हस्तांतरित होते हे labs ना अजून ठरवावे लागेल. तरीही, startup एका प्रत्यक्ष मर्यादेला लक्ष्य करत आहे. world-model research वेगाने पुढे गेल्यास, legally sourced आणि technically adaptable datasets ची मागणीही वाढण्याची शक्यता आहे.

त्यामुळे Origin Lab केवळ narrow licensing play राहात नाही. ते AI supply chain किती specialized होत चालली आहे याचे सुरुवातीचे लक्षण आहे. उद्योगाच्या पुढील टप्प्यात, महत्त्वाच्या कंपन्या केवळ models प्रशिक्षण देणाऱ्या नसतील. त्या models काय पाहू शकतील हे ठरवणाऱ्या देखील असतील.

हा लेख TechCrunch च्या वार्तांकनावर आधारित आहे. मूळ लेख वाचा.

Originally published on techcrunch.com