దీర్ఘ AI సంగీత సృష్టి కోసం Stability AI Audio 3.0 మోడళ్లను విడుదల చేసింది

Stability AI సంగీత సృష్టిని మరింత దీర్ఘ రూపాలకు తీసుకెళ్తోంది

AI-సృష్టిత ఆడియోను మరింత పొడవుగా, మరింత సౌకర్యవంతంగా, మరియు వివిధ పరికరాల్లో సులభంగా అమలు చేయగలిగేలా చేయాలనే లక్ష్యంతో Stability AI తన ఆడియో ఆకాంక్షలను ఒక కొత్త సంగీతం మరియు సౌండ్ మోడళ్ల కుటుంబంతో విస్తరిస్తోంది. కంపెనీ ప్రకారం, దాని కొత్త Stability Audio 3.0 శ్రేణిలో పరికరంలోనే ఉపయోగించేందుకు రూపొందించిన చిన్న వ్యవస్థల నుంచి ఆరు నిమిషాలకు పైగా పూర్తి సంగీత భాగాలను సృష్టించగల పెద్ద మోడళ్ల వరకు నాలుగు మోడళ్లు ఉన్నాయి.

ఈ కొత్త విడుదల రెండు కారణాల వల్ల ముఖ్యమైనది. మొదట, ఇది కంపెనీ గత open వెర్షన్లతో పోలిస్తే జనరేషన్ పొడవును గణనీయంగా పెంచుతుంది. రెండవది, AI ఆడియోకు మరింత విభజిత వ్యూహాన్ని ఇది ప్రతిబింబిస్తుంది; ఇందులో deployment లక్ష్యం మరియు licensing మోడల్ raw quality లాగే ముఖ్యమవుతున్నాయి. Stability ఒకే universal model‌ను పంపించడం లేదు. అది ఒక portfolioను పంపిస్తోంది.

నాలుగు మోడళ్లు, వేర్వేరు వినియోగ సందర్భాలు

ఇచ్చిన source text ప్రకారం, Stability Audio 3.0 కుటుంబంలో small SFX, small, medium, మరియు large వేరియంట్లు ఉన్నాయి. ఈ రెండు చిన్న మోడళ్లలో ఒక్కొక్కటిలో 459 మిలియన్ parameters ఉన్నాయి, మరియు ఇవి పరికరంలోనే sound మరియు music generation కోసం ఉద్దేశించబడ్డాయి, గరిష్ఠంగా రెండు నిమిషాల వరకూ tracks‌ను సపోర్ట్ చేస్తాయి. medium model 1.4 బిలియన్ parameters‌తో, large model 2.7 బిలియన్ parameters‌తో వస్తుంది.

చిన్న clips కంటే పూర్తి పాటలపై దృష్టి పెట్టే వినియోగదారులకు, అతిపెద్ద మార్పు పై స్థాయిలో ఉంది. Stability ప్రకారం, medium మరియు large models 6 నిమిషాలు 20 సెకన్ల వరకూ compositions‌ను సృష్టించగలవు, అదే సమయంలో melodic tone మరియు మొత్తం సంగీత నిర్మాణాన్ని నిలుపుకుంటాయి. ఇది 2024లో విడుదలైన Stability Audio 2.0 మద్దతిచ్చిన పొడవుకంటే రెండింతలకుపైగా, అలాగే మునుపటి Stable Audio Open విడుదలలో ఉన్న 47-సెకన్ల పరిమితికంటే చాలా దూరంగా ఉంది.

సంగీత సృష్టిలో పొడవు కేవలం అలంకారిక ప్రమాణం కాదు. చిన్న clips effects, loops, మరియు concepting‌కు సరిపోతాయి, కానీ దీర్ఘ-రూప జనరేషన్ మరింత పూర్తి demos, soundtrack sketches, మరియు draft compositions‌కు అవకాశాన్ని పెంచుతుంది. ఇది వేర్వేరు audio క్షణాలకంటే continuity మరియు development అవసరమయ్యే creators‌కు ఈ మోడళ్లను మరింత సంబంధితంగా చేస్తుంది.

Night sky reveals Milky Way above Turkiye’s Yozgat forest

OMB గ్రాంట్ ప్రతిపాదనపై అంతరిక్ష విజ్ఞాన వాదుల తీవ్ర వ్యతిరేకత

ప్రతిపాదిత ఫెడరల్ గ్రాంట్ నియమం అసాధారణంగా పెద్ద ప్రజా స్పందనను రేకెత్తించింది, అమెరికా విజ్ఞానం ఎలా నిధులు పొందుతుంది మరియు ఎలా పంచబడుతుంది అనే దాన్ని ఇది మార్చవచ్చని అంతరిక్ష విధాన వాదులు హెచ్చరిస్తున్నారు.

Read article

Open weights, కానీ పరిమితులతో

Stability, విస్తృతంగా స్వీకరించబడాలని కోరుకునే వాటి మరియు మరింత కఠినంగా commercialize చేయాలని ప్లాన్ చేసే వాటి మధ్య ఒక గీతను గీస్తోంది. కంపెనీ small SFX, small, మరియు medium మోడళ్లను open weights‌తో అందిస్తోంది, దీని ద్వారా developers మరియు researchers వాటిని ఉపయోగించడానికి మరియు మార్చడానికి వీలుంటుంది. దీనికి విరుద్ధంగా, large model‌ను API మరియు paid self-hosting ఎంపికల వెనుక ఉంచుతోంది. సంవత్సరానికి 1 మిలియన్ డాలర్లకన్నా ఎక్కువ ఆదాయం ఉన్న కంపెనీలకు enterprise license అవసరం.

ఈ నిర్మాణం మార్కెట్ ఎటు వెళ్తోంది అనే విషయాన్ని చాలా చెబుతోంది. Open-weight విడుదలలు ఇప్పటికీ శక్తివంతమైన distribution tool‌గా ఉన్నాయి, ముఖ్యంగా developer goodwill మరియు ecosystem growth కోసం. కానీ అత్యంత సామర్థ్యం ఉన్న model తరచుగా monetized tier‌గా మారుతుంది, ముఖ్యంగా inference ఖర్చులు మరియు enterprise డిమాండ్ పెరుగుతున్నప్పుడు. Stability ఇప్పటికే image మరియు language AIలో తెలిసిన నమూనాను అనుసరిస్తోంది: growth engine‌గా openness, business layer‌గా నియంత్రిత access.

లైసెన్సింగ్ ప్రశ్న ఇప్పుడు కేంద్రంలో ఉంది

సంగీత-సృష్టి రంగంపై వేలాడుతున్న మరో ప్రధాన సమస్య training data. ఇచ్చిన source text Stability విడుదలను music AI చుట్టూ కొనసాగుతున్న చట్టపరమైన ఒత్తిడి నేపథ్యంలో ఉంచుతోంది, Suno మరియు Udio involved ఉన్న కోర్టు పోరాటాలను సూచిస్తూ. ఈ వాతావరణంలో licensing ఒక పక్క విషయం కాదు. అది ప్రధాన పోటీ అంశాలలో ఒకటి.

తాజా audio models పూర్తిగా licensed dataపై నిర్మించబడ్డాయని Stability చెబుతోంది. ఈ క్లెయిమ్ ప్రత్యేకంగా ముఖ్యమైనది, ఎందుకంటే AI సంగీతంలో దీర్ఘకాల వాణిజ్య స్థిరత్వం ఒక పాటను ఎవరు సృష్టించగలరో దానికంటే, labels, publishers, మరియు enterprise customers అంగీకరించగల rights structure‌తో దాన్ని ఎవరు సృష్టించగలరో అనే అంశంపై ఎక్కువగా ఆధారపడవచ్చు. గత సంవత్సరం, Stability Warner Music Group మరియు Universal Music Group‌తో models మరియు music-creation tools అభివృద్ధి చేయడానికి ఒప్పందాలు కుదుర్చుకుంది. ఆ సంబంధాలు ఇప్పుడు branding విజయాల కన్నా, చట్టపరంగా వివాదాస్పదమైన మార్కెట్లో నిలబడటానికి మౌలిక సదుపాయాల్లా కనిపిస్తున్నాయి.

జూల్కా హాట్ట్యాప్ గో రివ్యూ: సాహసికుల కోసం $700 పోర్టబుల్ షవర్

జూల్కా హాట్ట్యాప్ గో అనేది క్యాంపింగ్, వ్యాన్ లైఫ్ మరియు అవుట్డోర్ వర్క్ కోసం ప్రీమియం ఆల్-ఇన్-వన్ పోర్టబుల్ హాట్ వాటర్ సిస్టమ్. ధర $554 ప్లస్ ఆప్షనల్ బ్యాటరీతో, ఇది సౌలభ్యం మరియు సౌకర్యాన్ని అందిస్తుంది కానీ ఖరీదైనది.

Read article

వృత్తిపరమైన సంగీతకారుల కోసం పెద్ద ప్రయత్నం

ఈ విడుదల విస్తృత product strategyని కూడా సూచిస్తుంది. Stability ప్రకారం, అది professional musicians కోసం కొత్త products suiteను అభివృద్ధి చేస్తోంది, అయితే ఇచ్చిన text‌లో feature details‌ను వెల్లడించలేదు. అలాగే, Universal Audio మరియు Fenderలో former chief digital officer‌గా ఉన్న Ethan Kaplanను తన professional music offering‌ను నడిపించడానికి నియమించింది.

ఈ move generative audio కంపెనీలలోని broader trendను ప్రతిబింబిస్తుంది; వీటిలో అనేకం ఇప్పుడు credibilityను పెంచడానికి, licensing, partnerships, మరియు go-to-market strategyని నడిపించడానికి music-industry executives‌ను నియమిస్తున్నాయి. టెక్నాలజీ వేగంగా మెరుగవుతోంది, కానీ కంపెనీలకు model capabilityతో సమానంగా domain fluency కూడా increasingly అవసరం.

చిన్న మోడళ్లు పరికరంలోనే గరిష్ఠంగా రెండు నిమిషాల వరకూ జనరేషన్ కోసం ఉద్దేశించబడ్డాయి.
Medium మరియు large మోడళ్లు 6 నిమిషాలు 20 సెకన్ల వరకూ దీర్ఘ compositions‌ను లక్ష్యంగా తీసుకుంటాయి.
మూడు మోడళ్లు open weights‌తో అందుబాటులో ఉన్నాయి, కాగా అతిపెద్దది paid access మరియు enterprise licensing కింద మరింత నియంత్రితంగా ఉంటుంది.
కొత్త మోడళ్లు పూర్తిగా licensed dataపై శిక్షణ పొందినవని Stability చెబుతోంది.

ఈ విడుదల ఎందుకు ముఖ్యమైనది

Stability Audio 3.0 సంగీత-AI చర్చను ముగించదు, మరియు కంపెనీ పనితీరు క్లెయిమ్లు చివరికి creators మరియు developers చేతనే అంచనా వేయబడతాయి. అయినప్పటికీ, ఈ launch పరిశ్రమకు ఒక ముఖ్యమైన సూచిక. ఇది దీర్ఘ-రూప జనరేషన్, మిశ్రమ open-and-commercial విడుదల వ్యూహం, మరియు licensing-first దృక్కోణాన్ని, audio AI మార్కెట్ novelty నుంచి infrastructure వైపు కదులుతున్న సమయంలో, ఒకచోట కలిపింది. మరో మాటలో చెప్పాలంటే, AI సంగీతం చేయగలదని నిరూపించడమే Stability లక్ష్యం కాదు. AI సంగీతాన్ని productize చేయవచ్చని, deploy చేయవచ్చని, మరియు పెద్ద స్థాయిలో commercialize చేయవచ్చని చూపించడానికి ప్రయత్నిస్తోంది.

ఈ వ్యాసం TechCrunch నివేదికలపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.

మెటాకు అడిక్టివ్ ఇన్స్టాగ్రామ్ మరియు ఫేస్బుక్ ఫీడ్లపై $12 బిలియన్ల EU జరిమానా

యూరోపియన్ కమిషన్ ప్రాథమికంగా మెటా డిజిటల్ సర్వీసెస్ చట్టాన్ని ఉల్లంఘించినట్లు కనుగొంది, ఇన్స్టాగ్రామ్ మరియు ఫేస్బుక్ యొక్క అడిక్టివ్ డిజైన్ కారణంగా $12 బిలియన్ల వరకు జరిమానా విధించే ప్రమాదం ఉంది.

Read article

Originally published on techcrunch.com

Stability AI కొత్త ఆడియో మోడళ్ల కుటుంబంతో సంగీత సృష్టిని విస్తరిస్తోంది

Stability AI సంగీత సృష్టిని మరింత దీర్ఘ రూపాలకు తీసుకెళ్తోంది

నాలుగు మోడళ్లు, వేర్వేరు వినియోగ సందర్భాలు

OMB గ్రాంట్ ప్రతిపాదనపై అంతరిక్ష విజ్ఞాన వాదుల తీవ్ర వ్యతిరేకత

Open weights, కానీ పరిమితులతో

లైసెన్సింగ్ ప్రశ్న ఇప్పుడు కేంద్రంలో ఉంది

జూల్కా హాట్ట్యాప్ గో రివ్యూ: సాహసికుల కోసం $700 పోర్టబుల్ షవర్

వృత్తిపరమైన సంగీతకారుల కోసం పెద్ద ప్రయత్నం

ఈ విడుదల ఎందుకు ముఖ్యమైనది

మెటాకు అడిక్టివ్ ఇన్స్టాగ్రామ్ మరియు ఫేస్బుక్ ఫీడ్లపై $12 బిలియన్ల EU జరిమానా

Comments (0)

Keep Reading