Stability AI సంగీత సృష్టిని మరింత దీర్ఘ రూపాలకు తీసుకెళ్తోంది

AI-సృష్టిత ఆడియోను మరింత పొడవుగా, మరింత సౌకర్యవంతంగా, మరియు వివిధ పరికరాల్లో సులభంగా అమలు చేయగలిగేలా చేయాలనే లక్ష్యంతో Stability AI తన ఆడియో ఆకాంక్షలను ఒక కొత్త సంగీతం మరియు సౌండ్ మోడళ్ల కుటుంబంతో విస్తరిస్తోంది. కంపెనీ ప్రకారం, దాని కొత్త Stability Audio 3.0 శ్రేణిలో పరికరంలోనే ఉపయోగించేందుకు రూపొందించిన చిన్న వ్యవస్థల నుంచి ఆరు నిమిషాలకు పైగా పూర్తి సంగీత భాగాలను సృష్టించగల పెద్ద మోడళ్ల వరకు నాలుగు మోడళ్లు ఉన్నాయి.

ఈ కొత్త విడుదల రెండు కారణాల వల్ల ముఖ్యమైనది. మొదట, ఇది కంపెనీ గత open వెర్షన్లతో పోలిస్తే జనరేషన్ పొడవును గణనీయంగా పెంచుతుంది. రెండవది, AI ఆడియోకు మరింత విభజిత వ్యూహాన్ని ఇది ప్రతిబింబిస్తుంది; ఇందులో deployment లక్ష్యం మరియు licensing మోడల్ raw quality లాగే ముఖ్యమవుతున్నాయి. Stability ఒకే universal model‌ను పంపించడం లేదు. అది ఒక portfolioను పంపిస్తోంది.

నాలుగు మోడళ్లు, వేర్వేరు వినియోగ సందర్భాలు

ఇచ్చిన source text ప్రకారం, Stability Audio 3.0 కుటుంబంలో small SFX, small, medium, మరియు large వేరియంట్లు ఉన్నాయి. ఈ రెండు చిన్న మోడళ్లలో ఒక్కొక్కటిలో 459 మిలియన్ parameters ఉన్నాయి, మరియు ఇవి పరికరంలోనే sound మరియు music generation కోసం ఉద్దేశించబడ్డాయి, గరిష్ఠంగా రెండు నిమిషాల వరకూ tracks‌ను సపోర్ట్ చేస్తాయి. medium model 1.4 బిలియన్ parameters‌తో, large model 2.7 బిలియన్ parameters‌తో వస్తుంది.

చిన్న clips కంటే పూర్తి పాటలపై దృష్టి పెట్టే వినియోగదారులకు, అతిపెద్ద మార్పు పై స్థాయిలో ఉంది. Stability ప్రకారం, medium మరియు large models 6 నిమిషాలు 20 సెకన్ల వరకూ compositions‌ను సృష్టించగలవు, అదే సమయంలో melodic tone మరియు మొత్తం సంగీత నిర్మాణాన్ని నిలుపుకుంటాయి. ఇది 2024లో విడుదలైన Stability Audio 2.0 మద్దతిచ్చిన పొడవుకంటే రెండింతలకుపైగా, అలాగే మునుపటి Stable Audio Open విడుదలలో ఉన్న 47-సెకన్ల పరిమితికంటే చాలా దూరంగా ఉంది.

సంగీత సృష్టిలో పొడవు కేవలం అలంకారిక ప్రమాణం కాదు. చిన్న clips effects, loops, మరియు concepting‌కు సరిపోతాయి, కానీ దీర్ఘ-రూప జనరేషన్ మరింత పూర్తి demos, soundtrack sketches, మరియు draft compositions‌కు అవకాశాన్ని పెంచుతుంది. ఇది వేర్వేరు audio క్షణాలకంటే continuity మరియు development అవసరమయ్యే creators‌కు ఈ మోడళ్లను మరింత సంబంధితంగా చేస్తుంది.

Open weights, కానీ పరిమితులతో

Stability, విస్తృతంగా స్వీకరించబడాలని కోరుకునే వాటి మరియు మరింత కఠినంగా commercialize చేయాలని ప్లాన్ చేసే వాటి మధ్య ఒక గీతను గీస్తోంది. కంపెనీ small SFX, small, మరియు medium మోడళ్లను open weights‌తో అందిస్తోంది, దీని ద్వారా developers మరియు researchers వాటిని ఉపయోగించడానికి మరియు మార్చడానికి వీలుంటుంది. దీనికి విరుద్ధంగా, large model‌ను API మరియు paid self-hosting ఎంపికల వెనుక ఉంచుతోంది. సంవత్సరానికి 1 మిలియన్ డాలర్లకన్నా ఎక్కువ ఆదాయం ఉన్న కంపెనీలకు enterprise license అవసరం.

ఈ నిర్మాణం మార్కెట్ ఎటు వెళ్తోంది అనే విషయాన్ని చాలా చెబుతోంది. Open-weight విడుదలలు ఇప్పటికీ శక్తివంతమైన distribution tool‌గా ఉన్నాయి, ముఖ్యంగా developer goodwill మరియు ecosystem growth కోసం. కానీ అత్యంత సామర్థ్యం ఉన్న model తరచుగా monetized tier‌గా మారుతుంది, ముఖ్యంగా inference ఖర్చులు మరియు enterprise డిమాండ్ పెరుగుతున్నప్పుడు. Stability ఇప్పటికే image మరియు language AIలో తెలిసిన నమూనాను అనుసరిస్తోంది: growth engine‌గా openness, business layer‌గా నియంత్రిత access.

లైసెన్సింగ్ ప్రశ్న ఇప్పుడు కేంద్రంలో ఉంది

సంగీత-సృష్టి రంగంపై వేలాడుతున్న మరో ప్రధాన సమస్య training data. ఇచ్చిన source text Stability విడుదలను music AI చుట్టూ కొనసాగుతున్న చట్టపరమైన ఒత్తిడి నేపథ్యంలో ఉంచుతోంది, Suno మరియు Udio involved ఉన్న కోర్టు పోరాటాలను సూచిస్తూ. ఈ వాతావరణంలో licensing ఒక పక్క విషయం కాదు. అది ప్రధాన పోటీ అంశాలలో ఒకటి.

తాజా audio models పూర్తిగా licensed dataపై నిర్మించబడ్డాయని Stability చెబుతోంది. ఈ క్లెయిమ్ ప్రత్యేకంగా ముఖ్యమైనది, ఎందుకంటే AI సంగీతంలో దీర్ఘకాల వాణిజ్య స్థిరత్వం ఒక పాటను ఎవరు సృష్టించగలరో దానికంటే, labels, publishers, మరియు enterprise customers అంగీకరించగల rights structure‌తో దాన్ని ఎవరు సృష్టించగలరో అనే అంశంపై ఎక్కువగా ఆధారపడవచ్చు. గత సంవత్సరం, Stability Warner Music Group మరియు Universal Music Group‌తో models మరియు music-creation tools అభివృద్ధి చేయడానికి ఒప్పందాలు కుదుర్చుకుంది. ఆ సంబంధాలు ఇప్పుడు branding విజయాల కన్నా, చట్టపరంగా వివాదాస్పదమైన మార్కెట్లో నిలబడటానికి మౌలిక సదుపాయాల్లా కనిపిస్తున్నాయి.

వృత్తిపరమైన సంగీతకారుల కోసం పెద్ద ప్రయత్నం

ఈ విడుదల విస్తృత product strategyని కూడా సూచిస్తుంది. Stability ప్రకారం, అది professional musicians కోసం కొత్త products suiteను అభివృద్ధి చేస్తోంది, అయితే ఇచ్చిన text‌లో feature details‌ను వెల్లడించలేదు. అలాగే, Universal Audio మరియు Fenderలో former chief digital officer‌గా ఉన్న Ethan Kaplanను తన professional music offering‌ను నడిపించడానికి నియమించింది.

ఈ move generative audio కంపెనీలలోని broader trendను ప్రతిబింబిస్తుంది; వీటిలో అనేకం ఇప్పుడు credibilityను పెంచడానికి, licensing, partnerships, మరియు go-to-market strategyని నడిపించడానికి music-industry executives‌ను నియమిస్తున్నాయి. టెక్నాలజీ వేగంగా మెరుగవుతోంది, కానీ కంపెనీలకు model capabilityతో సమానంగా domain fluency కూడా increasingly అవసరం.

  • చిన్న మోడళ్లు పరికరంలోనే గరిష్ఠంగా రెండు నిమిషాల వరకూ జనరేషన్ కోసం ఉద్దేశించబడ్డాయి.
  • Medium మరియు large మోడళ్లు 6 నిమిషాలు 20 సెకన్ల వరకూ దీర్ఘ compositions‌ను లక్ష్యంగా తీసుకుంటాయి.
  • మూడు మోడళ్లు open weights‌తో అందుబాటులో ఉన్నాయి, కాగా అతిపెద్దది paid access మరియు enterprise licensing కింద మరింత నియంత్రితంగా ఉంటుంది.
  • కొత్త మోడళ్లు పూర్తిగా licensed dataపై శిక్షణ పొందినవని Stability చెబుతోంది.

ఈ విడుదల ఎందుకు ముఖ్యమైనది

Stability Audio 3.0 సంగీత-AI చర్చను ముగించదు, మరియు కంపెనీ పనితీరు క్లెయిమ్లు చివరికి creators మరియు developers చేతనే అంచనా వేయబడతాయి. అయినప్పటికీ, ఈ launch పరిశ్రమకు ఒక ముఖ్యమైన సూచిక. ఇది దీర్ఘ-రూప జనరేషన్, మిశ్రమ open-and-commercial విడుదల వ్యూహం, మరియు licensing-first దృక్కోణాన్ని, audio AI మార్కెట్ novelty నుంచి infrastructure వైపు కదులుతున్న సమయంలో, ఒకచోట కలిపింది. మరో మాటలో చెప్పాలంటే, AI సంగీతం చేయగలదని నిరూపించడమే Stability లక్ష్యం కాదు. AI సంగీతాన్ని productize చేయవచ్చని, deploy చేయవచ్చని, మరియు పెద్ద స్థాయిలో commercialize చేయవచ్చని చూపించడానికి ప్రయత్నిస్తోంది.

ఈ వ్యాసం TechCrunch నివేదికలపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.

Originally published on techcrunch.com