ஒரு புதிய தரவு வழங்குநர் game worlds-ஐ நிஜ உலகுக்கான machine intelligence-ஐப் பயிற்றுவிக்க முடியும் என்று பந்தயம் வைக்கிறது
Origin Lab, AI labs மற்றும் so-called world models உருவாக்கும் video game நிறுவனங்களை இணைக்கும் ஒரு சந்தையைக் கட்டமைக்க 8 மில்லியன் டாலர் seed round-ஐ திரட்டியுள்ளது. கருத்து எளிமையானது, ஆனால் முக்கியத்துவம் வாய்ந்ததாக இருக்கக்கூடும்: AI systems text-ஐத் தாண்டி robotics, simulation, மற்றும் physical reasoning-க்கு நகரும் போது, பொருட்கள், இடங்கள், இயக்கம் எப்படி நடக்கிறது என்பதைப் பிடிக்கும் பயிற்சி தரவு அவற்றுக்குத் தேவைப்படுகிறது. அந்தப் பயன்பாட்டு தரவின் பெரும்பகுதி ஏற்கனவே video game industry-க்குள் இருப்பதாக Origin Lab வாதிடுகிறது.
இந்த round-ஐ Lightspeed Ventures வழிநடத்தியது; SV Angel, Eniac, Seven Stars, FPV ஆகியவை பங்கேற்றன. அதோடு Twitch co-founder Kevin Lin மற்றும் Cruise founder Kyle Vogt ஆகியோரின் angel backing-உம் இருந்தது. அந்த investor list முக்கியமானது, ஏனெனில் நிறுவனம் ஒரு niche content licensing business-ஆக மட்டும் அல்ல, வளர்ந்து வரும் AI supply chain-க்கான infrastructure-ஆகவும் பார்க்கப்படுகிறதைக் காட்டுகிறது.
world-model builders-க்கு ஏன் வேறு வகை தரவு தேவை
Large language models பரந்த இணைய உரையின் அடிப்படையில் உருவாக்கப்பட்டன. physical environments-ஐ reasoning செய்யும் systems-க்கு அத்தகைய எளிதான data reservoir இல்லை. Origin Lab co-founder Anne-Margot Rodde கூறுவதன்படி, இப்போது உருவாக்கப்படும் AI systems physical உலகம் எவ்வாறு வேலை செய்கிறது, பொருட்கள் எவ்வாறு நகர்கின்றன என்பதைப் புரிந்துகொள்ள வேண்டும். அதனால் language completion-க்குப் பதிலாக spatial reasoning-க்கு பயன்படும் உயர் தர, உரிமை தெளிவான தரவு bottleneck உருவாகிறது.
Video games ஒரு ஈர்க்கும் ஆதாரமாக உள்ளன; ஏனெனில் அவற்றில் digital environments, objects, interactions, motion patterns ஆகியவை உள்ளன, அவற்றை render, record, அல்லது model-ready formats-ஆக மாற்றலாம். Origin Lab-ன் பார்வையில், industry மதிப்புமிக்க assets-கள்மேல் அமர்ந்திருக்கிறது, ஆனால் அவற்றை AI labs-க்கு திறம்பட package செய்து license செய்யும் infrastructure இல்லை. Startup கூறுவது என்னவென்றால், அது அந்த பாலமாக செயல்பட்டு, ஏற்கனவே உள்ள game assets-ஐ training data-ஆக மாற்றும்; இதில் rendered scenes முதல் automated gameplay footage வரை இருக்கலாம்.
வணிகக் கோணம் licensing மற்றும் data quality-யை பொறுத்தது
இந்தக் கருத்து முழுமையாக புதியது அல்ல. AI labs பல காலமாக game footage மற்றும் game-like simulation environments-இல் ஆர்வம் கொண்டுள்ளன. காணாமல் இருந்தது, சட்டபூர்வ அணுகல் மற்றும் பயன்பாட்டு சிக்கல்களை ஒரே நேரத்தில் தீர்க்கக்கூடிய வலுவான commercial layer. source text குறிப்பிட்டபடி, licensing மற்றும் data-quality பிரச்சினைகள் பெரும்பாலும் பயன்பாட்டைத் தடுத்துள்ளன. அதில்தான் Origin Lab தன்னை வேறுபடுத்த முயல்கிறது.
AI labs-க்கு, உரிமம் பெற்ற inputs scraped அல்லது informal sources-இல் இருந்து வரும் தரவுகளுடன் இணைந்த legal ambiguity-யை குறைக்கின்றன. game companies-க்கு, இம்மாதிரி ஏற்கனவே உருவாக்கப்பட்ட digital assets-இலிருந்து புதிய வருவாய் வழி கிடைக்கும். platform வேலை செய்தால், sales மற்றும் engagement மூலம் ஏற்கனவே monetized செய்யப்பட்ட content-ஐ model training-க்கான secondary market-ஆக மாற்ற முடியும்.
இதனால்தான் நிறுவனத்தின் timing முக்கியம். 2024 இறுதியில் Sora-வின் ஆரம்ப version video game மற்றும் streamer footage-ஐ மீண்டும் உருவாக்கியது என்று தோன்றியபோது OpenAI-க்கு விமர்சனங்கள் எழுந்தன; இது training data provenance வணிக ரீதியாகவும் புகழ் ரீதியாகவும் உணர்வுப்பூர்வமானதாக மாறி வருவதை காட்டியது. Origin Lab ஒரு தூய்மையான பாதையை வழங்குகிறது: உரிமைகளைப் பெறுங்கள், தரவை standardize செய்யுங்கள், பின்னர் நம்பகமான supply-க்கு பணம் செலுத்தக்கூடிய labs-க்கு விற்குங்கள்.
Data vendors ஒரு மூலோபாய infrastructure ஆக மாறுகின்றன
Lightspeed partner Faraz Fatemi, major labs நன்றாக capitalized-ஆக உள்ளன, மேலும் data bottleneck ஆகவே உள்ளது என்ற familiar AI-adjacent business கதையின் கோணத்தில் வாய்ப்பை விளக்கியுள்ளார். இது evaluation, labeling, அல்லது data operations வழங்கும் நிறுவனங்களில் முதலீட்டாளர்கள் முன்பு கண்ட வளர்ச்சி கதையுடன் ஒத்திருக்கிறது. world-model development simulation-grade மற்றும் motion-rich datasets-ஐ மையமாகக் கொண்ட ஒரு ஒத்த supplier category-யை உருவாக்கும் என்பதே Origin Lab-ன் பந்தயம்.
இந்த மாற்றத்தின் முக்கியத்துவம் ஒரு startup-ஐத் தாண்டுகிறது. AI economy proprietary அல்லது structured datasets model architectures போலவே மூலோபாய ரீதியாக மதிப்புமிக்கவையாக மாறும் கட்டத்துக்குள் நுழைகிறது என்பதைக் இது சுட்டிக்காட்டுகிறது. அந்தச் சூழலில், அரிதான தரவை source, legalize, and operationalize செய்யக்கூடிய நிறுவனங்கள் frontier models உருவாக்காமலேயே சக்திவாய்ந்த இடைநிலையர்களாக மாறலாம்.
அடுத்த AI battle என்ன என்பதை இது சொல்கிறது
Origin Lab-ன் pitch AI priorities-ல் ஒரு பரந்த மாற்றத்தை பிரதிபலிக்கிறது. கேள்வி இனி text generation-ஐ scale செய்வது மட்டும் அல்ல. environments-ஐ உணரக்கூடிய, objects-ஐப் பற்றி reasoning செய்யக்கூடிய, இறுதியில் physical உலகுடன் தொடர்புகொள்ளக்கூடிய systems-ஐ உருவாக்குவது தான். இது சந்தையை புதிய வகை data-க்குத் தள்ளுகிறது, அதைப் பயன்படுத்த உதவும் businesses-க்குத் தள்ளுகிறது.
game assets world models-க்கான அடிப்படை input ஆக மாறுமா என்பது இன்னும் நிரூபிக்கப்படவில்லை. synthetic environments பயனுள்ளதாக உள்ளன, ஆனால் அவை நிஜ உலகம் அல்ல, மேலும் game-derived data robotics அல்லது embodied intelligence பயன்பாடுகளில் எவ்வளவு நன்றாக இடமாற்றம் பெறுகிறது என்பதை labs இன்னும் தீர்மானிக்க வேண்டியுள்ளது. அதே சமயம், startup ஒரு உண்மையான constraint-ஐ இலக்காகக் கொண்டுள்ளது. world-model research வேகமடைந்தால், legally sourced மற்றும் technically adaptable datasets-க்கான demand கூட உயரும்.
அதனால் Origin Lab வெறும் narrow licensing play-ஐ விட அதிகமாகிறது. இது AI supply chain எவ்வளவு சிறப்புப் படுத்தப்பட்டதாக மாறுகிறது என்பதற்கான ஆரம்பக் குறிகாட்டி. அடுத்த கட்டத்தில் முக்கியத்துவம் பெறும் நிறுவனங்கள் models-ஐ பயிற்றுவிப்பவை மட்டுமல்ல; models என்ன பார்க்கலாம் என்பதை நிர்ணயிப்பவையும் ஆகலாம்.
இந்தக் கட்டுரை TechCrunch வழங்கிய செய்தியை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on techcrunch.com







