Stability AI సంగీత సృష్టిని మరింత దీర్ఘ రూపాలకు తీసుకెళ్తోంది
AI-సృష్టిత ఆడియోను మరింత పొడవుగా, మరింత సౌకర్యవంతంగా, మరియు వివిధ పరికరాల్లో సులభంగా అమలు చేయగలిగేలా చేయాలనే లక్ష్యంతో Stability AI తన ఆడియో ఆకాంక్షలను ఒక కొత్త సంగీతం మరియు సౌండ్ మోడళ్ల కుటుంబంతో విస్తరిస్తోంది. కంపెనీ ప్రకారం, దాని కొత్త Stability Audio 3.0 శ్రేణిలో పరికరంలోనే ఉపయోగించేందుకు రూపొందించిన చిన్న వ్యవస్థల నుంచి ఆరు నిమిషాలకు పైగా పూర్తి సంగీత భాగాలను సృష్టించగల పెద్ద మోడళ్ల వరకు నాలుగు మోడళ్లు ఉన్నాయి.
ఈ కొత్త విడుదల రెండు కారణాల వల్ల ముఖ్యమైనది. మొదట, ఇది కంపెనీ గత open వెర్షన్లతో పోలిస్తే జనరేషన్ పొడవును గణనీయంగా పెంచుతుంది. రెండవది, AI ఆడియోకు మరింత విభజిత వ్యూహాన్ని ఇది ప్రతిబింబిస్తుంది; ఇందులో deployment లక్ష్యం మరియు licensing మోడల్ raw quality లాగే ముఖ్యమవుతున్నాయి. Stability ఒకే universal modelను పంపించడం లేదు. అది ఒక portfolioను పంపిస్తోంది.
నాలుగు మోడళ్లు, వేర్వేరు వినియోగ సందర్భాలు
ఇచ్చిన source text ప్రకారం, Stability Audio 3.0 కుటుంబంలో small SFX, small, medium, మరియు large వేరియంట్లు ఉన్నాయి. ఈ రెండు చిన్న మోడళ్లలో ఒక్కొక్కటిలో 459 మిలియన్ parameters ఉన్నాయి, మరియు ఇవి పరికరంలోనే sound మరియు music generation కోసం ఉద్దేశించబడ్డాయి, గరిష్ఠంగా రెండు నిమిషాల వరకూ tracksను సపోర్ట్ చేస్తాయి. medium model 1.4 బిలియన్ parametersతో, large model 2.7 బిలియన్ parametersతో వస్తుంది.
చిన్న clips కంటే పూర్తి పాటలపై దృష్టి పెట్టే వినియోగదారులకు, అతిపెద్ద మార్పు పై స్థాయిలో ఉంది. Stability ప్రకారం, medium మరియు large models 6 నిమిషాలు 20 సెకన్ల వరకూ compositionsను సృష్టించగలవు, అదే సమయంలో melodic tone మరియు మొత్తం సంగీత నిర్మాణాన్ని నిలుపుకుంటాయి. ఇది 2024లో విడుదలైన Stability Audio 2.0 మద్దతిచ్చిన పొడవుకంటే రెండింతలకుపైగా, అలాగే మునుపటి Stable Audio Open విడుదలలో ఉన్న 47-సెకన్ల పరిమితికంటే చాలా దూరంగా ఉంది.
సంగీత సృష్టిలో పొడవు కేవలం అలంకారిక ప్రమాణం కాదు. చిన్న clips effects, loops, మరియు conceptingకు సరిపోతాయి, కానీ దీర్ఘ-రూప జనరేషన్ మరింత పూర్తి demos, soundtrack sketches, మరియు draft compositionsకు అవకాశాన్ని పెంచుతుంది. ఇది వేర్వేరు audio క్షణాలకంటే continuity మరియు development అవసరమయ్యే creatorsకు ఈ మోడళ్లను మరింత సంబంధితంగా చేస్తుంది.
Open weights, కానీ పరిమితులతో
Stability, విస్తృతంగా స్వీకరించబడాలని కోరుకునే వాటి మరియు మరింత కఠినంగా commercialize చేయాలని ప్లాన్ చేసే వాటి మధ్య ఒక గీతను గీస్తోంది. కంపెనీ small SFX, small, మరియు medium మోడళ్లను open weightsతో అందిస్తోంది, దీని ద్వారా developers మరియు researchers వాటిని ఉపయోగించడానికి మరియు మార్చడానికి వీలుంటుంది. దీనికి విరుద్ధంగా, large modelను API మరియు paid self-hosting ఎంపికల వెనుక ఉంచుతోంది. సంవత్సరానికి 1 మిలియన్ డాలర్లకన్నా ఎక్కువ ఆదాయం ఉన్న కంపెనీలకు enterprise license అవసరం.
ఈ నిర్మాణం మార్కెట్ ఎటు వెళ్తోంది అనే విషయాన్ని చాలా చెబుతోంది. Open-weight విడుదలలు ఇప్పటికీ శక్తివంతమైన distribution toolగా ఉన్నాయి, ముఖ్యంగా developer goodwill మరియు ecosystem growth కోసం. కానీ అత్యంత సామర్థ్యం ఉన్న model తరచుగా monetized tierగా మారుతుంది, ముఖ్యంగా inference ఖర్చులు మరియు enterprise డిమాండ్ పెరుగుతున్నప్పుడు. Stability ఇప్పటికే image మరియు language AIలో తెలిసిన నమూనాను అనుసరిస్తోంది: growth engineగా openness, business layerగా నియంత్రిత access.
లైసెన్సింగ్ ప్రశ్న ఇప్పుడు కేంద్రంలో ఉంది
సంగీత-సృష్టి రంగంపై వేలాడుతున్న మరో ప్రధాన సమస్య training data. ఇచ్చిన source text Stability విడుదలను music AI చుట్టూ కొనసాగుతున్న చట్టపరమైన ఒత్తిడి నేపథ్యంలో ఉంచుతోంది, Suno మరియు Udio involved ఉన్న కోర్టు పోరాటాలను సూచిస్తూ. ఈ వాతావరణంలో licensing ఒక పక్క విషయం కాదు. అది ప్రధాన పోటీ అంశాలలో ఒకటి.
తాజా audio models పూర్తిగా licensed dataపై నిర్మించబడ్డాయని Stability చెబుతోంది. ఈ క్లెయిమ్ ప్రత్యేకంగా ముఖ్యమైనది, ఎందుకంటే AI సంగీతంలో దీర్ఘకాల వాణిజ్య స్థిరత్వం ఒక పాటను ఎవరు సృష్టించగలరో దానికంటే, labels, publishers, మరియు enterprise customers అంగీకరించగల rights structureతో దాన్ని ఎవరు సృష్టించగలరో అనే అంశంపై ఎక్కువగా ఆధారపడవచ్చు. గత సంవత్సరం, Stability Warner Music Group మరియు Universal Music Groupతో models మరియు music-creation tools అభివృద్ధి చేయడానికి ఒప్పందాలు కుదుర్చుకుంది. ఆ సంబంధాలు ఇప్పుడు branding విజయాల కన్నా, చట్టపరంగా వివాదాస్పదమైన మార్కెట్లో నిలబడటానికి మౌలిక సదుపాయాల్లా కనిపిస్తున్నాయి.
వృత్తిపరమైన సంగీతకారుల కోసం పెద్ద ప్రయత్నం
ఈ విడుదల విస్తృత product strategyని కూడా సూచిస్తుంది. Stability ప్రకారం, అది professional musicians కోసం కొత్త products suiteను అభివృద్ధి చేస్తోంది, అయితే ఇచ్చిన textలో feature detailsను వెల్లడించలేదు. అలాగే, Universal Audio మరియు Fenderలో former chief digital officerగా ఉన్న Ethan Kaplanను తన professional music offeringను నడిపించడానికి నియమించింది.
ఈ move generative audio కంపెనీలలోని broader trendను ప్రతిబింబిస్తుంది; వీటిలో అనేకం ఇప్పుడు credibilityను పెంచడానికి, licensing, partnerships, మరియు go-to-market strategyని నడిపించడానికి music-industry executivesను నియమిస్తున్నాయి. టెక్నాలజీ వేగంగా మెరుగవుతోంది, కానీ కంపెనీలకు model capabilityతో సమానంగా domain fluency కూడా increasingly అవసరం.
- చిన్న మోడళ్లు పరికరంలోనే గరిష్ఠంగా రెండు నిమిషాల వరకూ జనరేషన్ కోసం ఉద్దేశించబడ్డాయి.
- Medium మరియు large మోడళ్లు 6 నిమిషాలు 20 సెకన్ల వరకూ దీర్ఘ compositionsను లక్ష్యంగా తీసుకుంటాయి.
- మూడు మోడళ్లు open weightsతో అందుబాటులో ఉన్నాయి, కాగా అతిపెద్దది paid access మరియు enterprise licensing కింద మరింత నియంత్రితంగా ఉంటుంది.
- కొత్త మోడళ్లు పూర్తిగా licensed dataపై శిక్షణ పొందినవని Stability చెబుతోంది.
ఈ విడుదల ఎందుకు ముఖ్యమైనది
Stability Audio 3.0 సంగీత-AI చర్చను ముగించదు, మరియు కంపెనీ పనితీరు క్లెయిమ్లు చివరికి creators మరియు developers చేతనే అంచనా వేయబడతాయి. అయినప్పటికీ, ఈ launch పరిశ్రమకు ఒక ముఖ్యమైన సూచిక. ఇది దీర్ఘ-రూప జనరేషన్, మిశ్రమ open-and-commercial విడుదల వ్యూహం, మరియు licensing-first దృక్కోణాన్ని, audio AI మార్కెట్ novelty నుంచి infrastructure వైపు కదులుతున్న సమయంలో, ఒకచోట కలిపింది. మరో మాటలో చెప్పాలంటే, AI సంగీతం చేయగలదని నిరూపించడమే Stability లక్ష్యం కాదు. AI సంగీతాన్ని productize చేయవచ్చని, deploy చేయవచ్చని, మరియు పెద్ద స్థాయిలో commercialize చేయవచ్చని చూపించడానికి ప్రయత్నిస్తోంది.
ఈ వ్యాసం TechCrunch నివేదికలపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.
Originally published on techcrunch.com




