Stability AI இசை உருவாக்கத்தை நீளமான வடிவங்களுக்கு தள்ளுகிறது
Stability AI, AI-யால் உருவாக்கப்படும் ஆடியோவை மேலும் நீளமாக, நெகிழ்வாக, மற்றும் பல்வேறு சாதனங்களில் எளிதாக இயக்கக்கூடியதாக மாற்றும் நோக்குடன், இசை மற்றும் ஒலி மாதிரிகளின் புதிய குடும்பத்தின் மூலம் தனது ஆடியோ முயற்சிகளை விரிவுபடுத்துகிறது. நிறுவனத்தின் கூற்றுப்படி, அதன் புதிய Stability Audio 3.0 வரிசையில், சாதனத்திலேயே பயன்பாட்டிற்காக உருவாக்கப்பட்ட சிறிய அமைப்புகளிலிருந்து, ஆறு நிமிடங்களுக்கு மேல் நீளமான முழுமையான இசைத் துண்டுகளை உருவாக்கக்கூடிய பெரிய மாதிரிகள் வரை நான்கு மாதிரிகள் உள்ளன.
இந்த புதிய வெளியீடு இரண்டு காரணங்களுக்காக முக்கியமானது. முதலில், நிறுவத்தின் முந்தைய open பதிப்புகளுடன் ஒப்பிடும்போது உருவாக்க நீளத்தை குறிப்பிடத்தக்க அளவில் விரிவுபடுத்துகிறது. இரண்டாவது, AI ஆடியோவுக்கான மேலும் பிரிக்கப்பட்ட ஒரு அணுகுமுறையை இது பிரதிபலிக்கிறது; இதில் deployment இலக்கும் licensing மாதிரியும் raw quality போலவே முக்கியமாகி வருகின்றன. Stability ஒரு universal model-ஐ வெளியிடவில்லை. அது ஒரு portfolio-வை வெளியிடுகிறது.
நான்கு மாதிரிகள், வேறுபட்ட பயன்பாடுகள்
வழங்கப்பட்ட மூல உரையின் படி, Stability Audio 3.0 குடும்பத்தில் small SFX, small, medium, மற்றும் large வகைகள் உள்ளன. சிறிய இரண்டு மாதிரிகளிலும் தலா 459 மில்லியன் parameters உள்ளன; அவை சாதனத்திலேயே ஒலி மற்றும் இசை உருவாக்கத்திற்காக வடிவமைக்கப்பட்டவை, மேலும் அதிகபட்சம் இரண்டு நிமிடங்கள் வரை உள்ள track-களை ஆதரிக்கின்றன. medium மாதிரி 1.4 பில்லியன் parameters கொண்டது, large மாதிரி 2.7 பில்லியன் parameters கொண்டது.
சிறிய clip-களை விட முழு பாடல்களில் கவனம் செலுத்தும் பயனர்களுக்கு, மிகப் பெரிய மாற்றம் உயர்நிலைப்படுத்தப்பட்ட வரம்பில் உள்ளது. medium மற்றும் large மாதிரிகள், இசைத் தொனியும் மொத்த கட்டமைப்பும் பாதுகாக்கப்பட்டபடி, 6 நிமிடங்கள் 20 விநாடிகள் வரை உள்ள compositions-ஐ உருவாக்க முடியும் என்று Stability கூறுகிறது. இது 2024-இல் வெளியான Stability Audio 2.0 ஆதரித்த நீளத்தை விட இரட்டிப்புக்கும் அதிகம்; மேலும் முந்தைய Stable Audio Open வெளியீட்டின் 47-விநாடி வரம்பை விட வெகுதூரம் முன்னேறியது.
இசை உருவாக்கத்தில் நீளம் என்பது வெறும் தோற்ற அளவுகோல் அல்ல. குறுகிய clip-கள் விளைவுகள், loops, மற்றும் concepting-க்கு பயன்படலாம்; ஆனால் நீளமான உருவாக்கம் முழுமையான demos, soundtrack sketches, மற்றும் draft compositions ஆகியவற்றுக்கான வாய்ப்பை அதிகரிக்கிறது. இது தனித்தனி audio தருணங்களைக் காட்டிலும் தொடர்ச்சியும் வளர்ச்சியும் தேவைப்படும் creators-க்கு இந்த மாதிரிகளை அதிகப் பொருத்தமானதாக ஆக்குகிறது.
Open weights, ஆனால் வரம்புகளுடன்
Stability, பரவலாக ஏற்றுக்கொள்ளப்பட வேண்டும் என்று விரும்பும் விஷயங்களுக்கும், அதிக கட்டுப்பாட்டுடன் monetization செய்ய திட்டமிடும் விஷயங்களுக்கும் இடையே ஒரு கோடு இழுக்கிறது. நிறுவனம் small SFX, small, மற்றும் medium மாதிரிகளை open weights-உடன் கிடைக்கச் செய்கிறது; இது developers மற்றும் researchers அவற்றைப் பயன்படுத்தவும் மாற்றவும் அனுமதிக்கிறது. ஆனால் large மாதிரி API மற்றும் paid self-hosting விருப்பங்களுக்குப் பின்னால் வைக்கப்படுகிறது. ஆண்டுக்கு 1 மில்லியன் டாலருக்கு மேல் வருவாய் உள்ள நிறுவனங்களுக்கு enterprise license தேவைப்படும்.
இந்த அமைப்பு சந்தை எந்த திசையில் செல்கிறது என்பதைக் காட்டுகிறது. Open-weight வெளியீடுகள் இன்னும் சக்திவாய்ந்த விநியோக கருவியாக உள்ளன; குறிப்பாக developer goodwill மற்றும் ecosystem growth-க்கு. ஆனால் மிகத் திறனான மாதிரிதான் பெரும்பாலும் monetized tier ஆகிறது, குறிப்பாக inference செலவுகளும் enterprise தேவையும் அதிகரிக்கும் போது. Stability, image மற்றும் language AI-யில் ஏற்கனவே பழகிய முறை ஒன்றை பின்பற்றுகிறது: growth engine ஆக openness, business layer ஆக கட்டுப்படுத்தப்பட்ட அணுகல்.
Licensing பற்றிய கேள்வி இப்போது மையமாக உள்ளது
இசை உருவாக்கத் துறையை சுற்றி தொங்கும் மற்றொரு பெரிய பிரச்சினை training data ஆகும். வழங்கப்பட்ட மூல உரை Stability-யின் வெளியீட்டை music AI தொடர்பான தொடர்ச்சியான சட்ட அழுத்தத்தின் சூழலில் வைக்கிறது, குறிப்பாக Suno மற்றும் Udio-வை உள்ளடக்கிய நீதிமன்ற வழக்குகளைச் சுட்டிக்காட்டுகிறது. இப்படியான சூழலில் licensing என்பது பக்கக் குறிப்பு அல்ல. அது முக்கியமான போட்டி மாறிலிகளில் ஒன்றாகும்.
தன்னுடைய சமீபத்திய audio மாதிரிகள் முழுமையாக licensed data-யை அடிப்படையாகக் கொண்டு உருவாக்கப்பட்டதாக Stability கூறுகிறது. இந்தக் கூற்று குறிப்பாக முக்கியமானது, ஏனெனில் AI இசையில் நீண்டகால வணிக நிலைத்தன்மை, ஒரு பாடலை யார் உருவாக்க முடியும் என்பதைக் காட்டிலும், labels, publishers, மற்றும் enterprise வாடிக்கையாளர்கள் ஏற்றுக்கொள்ளக்கூடிய rights structure-உடன் அதை யார் உருவாக்க முடியும் என்பதில் அதிகமாக சார்ந்திருக்கலாம். கடந்த ஆண்டு, Stability, models மற்றும் music-creation tools உருவாக்க Warner Music Group மற்றும் Universal Music Group உடன் உடன்பாடுகளுக்கு வந்தது. இப்போது அந்த உறவுகள் branding வெற்றிகளை விட, சட்ட ரீதியாக விவாதிக்கப்படும் சந்தையில் உயிர்வாழ்வதற்கான அடித்தளமாகவே தெரிகின்றன.
தொழில்முறை இசைக்கலைஞர்களுக்கான பெரிய முயற்சி
இந்த வெளியீடு ஒரு பெரிய product strategy-யையும் சுட்டிக்காட்டுகிறது. Stability, தொழில்முறை இசைக்கலைஞர்களுக்கான புதிய products suite-ஐ உருவாக்கி வருவதாக கூறுகிறது; ஆனால் வழங்கப்பட்ட உரையில் feature விவரங்களை வெளியிடவில்லை. மேலும், Universal Audio மற்றும் Fender-இன் முன்னாள் chief digital officer Ethan Kaplan-ஐ தனது professional music offering-ஐ வழிநடத்த நியமித்துள்ளது.
இந்த நகர்வு generative audio நிறுவனங்களில் காணப்படும் பரந்த போக்கை பிரதிபலிக்கிறது; இந்நிறுவனங்களில் பல இப்போது credibility-யை உயர்த்தவும், licensing, partnerships, மற்றும் go-to-market strategy-யை வழிநடத்தவும் music-industry executives-ஐ நியமிக்கின்றன. தொழில்நுட்பம் விரைவாக மேம்படுகிறது, ஆனால் நிறுவனங்களுக்கு model capability-க்குச் சமமாக domain fluency-மும் increasingly தேவைப்படுகிறது.
- சிறிய மாதிரிகள் சாதனத்திலேயே அதிகபட்சம் இரண்டு நிமிடங்கள் வரை உருவாக்குவதற்காக உள்ளன.
- Medium மற்றும் large மாதிரிகள் 6 நிமிடங்கள் 20 விநாடிகள் வரை நீளமான compositions-ஐ இலக்காகக் கொள்கின்றன.
- மூன்று மாதிரிகள் open weights-உடன் கிடைக்கின்றன, மிகப்பெரிய மாதிரி paid access மற்றும் enterprise licensing-க்கு உட்பட்டதாக உள்ளது.
- புதிய மாதிரிகள் முழுமையாக licensed data-யில் பயிற்சி செய்யப்பட்டதாக Stability கூறுகிறது.
இந்த வெளியீடு ஏன் முக்கியம்
Stability Audio 3.0 music-AI விவாதத்தை முடிக்கவில்லை; நிறுவனத்தின் செயல்திறன் குறித்த கூற்றுகள் இறுதியில் creators மற்றும் developers-ஆல் மதிப்பிடப்படும். ஆனால் இந்த launch இன்னும் துறைக்கான முக்கியக் குறிகாட்டியாக உள்ளது. இது நீளமான உருவாக்கம், கலந்த open-and-commercial release strategy, மற்றும் licensing-first அணுகுமுறையை இணைக்கிறது; audio AI சந்தை novelty-யிலிருந்து infrastructure-க்கு நகரும் ஒரு நேரத்தில். வேறு வார்த்தைகளில் சொன்னால், AI இசை செய்ய முடியும் என்பதை நிரூபிப்பதில் Stability இனி மட்டும் கவனம் செலுத்தவில்லை. AI இசையை productize, deploy, மற்றும் பெரிய அளவில் commercialize செய்ய முடியும் என்பதை காட்ட முயல்கிறது.
இந்தக் கட்டுரை TechCrunch வழங்கிய செய்தியை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on techcrunch.com








