Mshindani Mpya katika Mbio za Wanamitindo Huria

Alibaba imezindua familia yake ya hivi punde zaidi ya wanamitindo bandia wa akili, mfululizo wa Qwen 3.5, ikiimarisha ushindani wa kimataifa wa kutawala katika nafasi kubwa ya modeli ya lugha. Toleo hili lina miundo minne mahususi - Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, na Qwen3.5-27B - kila moja ikilenga hali tofauti za utumiaji na bajeti za hesabu huku ikishiriki usanifu wa kawaida ulioundwa kwa ufanisi na utendakazi wa moja kwa moja.

Nafasi kubwa ya teknolojia ni ya Kichina.

mshindani wa baadhi ya miundo ya kibiashara yenye uwezo zaidi inayopatikana leo, hasa GPT-5 mini ya OpenAI na Anthropic Claude Sonnet 4.5. Kinachofanya changamoto kuwa ya lazima si madai ya utendakazi tu, bali kiwango cha bei: Alibaba inasema miundo yake inatoa ubora unaolingana kwa sehemu ya gharama, hivyo kufanya uwezo wa AI wa hali ya juu kufikiwa na anuwai kubwa ya wasanidi programu na makampuni ya biashara.

Mstari wa Muundo

Familia ya Qwen 3.5 inachukua mbinu ya daraja la juu ya uzani wa juu kutoka kwa muundo wa uzani mwepesi katika kutoa muundo wa uzani mwepesi katika kutoa muundo wa uzani mwepesi. kazi. Mkataba wa kumtaja unaonyesha usanifu: miundo yenye nambari mbili zilizotenganishwa na "A" hutumia mbinu ya mchanganyiko wa wataalam (MoE), ambapo sehemu ndogo tu ya vigezo huwashwa kwa ingizo lolote, na hivyo kupunguza kwa kiasi kikubwa gharama za kukokotoa.

Qwen3.5-Flash ni lahaja iliyoboreshwa kwa kasi, iliyoundwa kwa ajili ya programu ambapo muda wa chini wa kusubiri na wa juu ni muhimu. Imewekwa kama suluhu la gharama nafuu kwa chatbots, uundaji wa maudhui, na majukumu ya lugha ya kawaida ambapo majibu ya papo hapo yana umuhimu zaidi ya kina cha juu zaidi cha hoja.

Muundo wa Qwen3.5-35B-A3B hutumia usanifu mdogo wa MoE wenye jumla ya vigezo bilioni 35 lakini bilioni 3 pekee zinazotumika wakati wowote. Muundo huu huiruhusu kupiga ngumi zaidi ya kiwango chake cha uzani wa kimahesabu, ikitoa ubora unaokaribia miundo mikubwa zaidi mnene huku ikihitaji sehemu ya kokotoo ya makisio.

Juu ya safu kuna Qwen3.5-122B-A10B, muundo wa kiwango kikubwa cha mchanganyiko wa wataalam wenye vigezo amilifu vya bilioni 122 na takriban bilioni 10 za vigezo amilifu. Muundo huu unalenga hoja zinazohitajika zaidi, uwekaji usimbaji na kazi za uchanganuzi, ambapo Alibaba inadai ushindani wa utendaji na miundo ya kibiashara ya mipakani.

Qwen3.5-27B hujumuisha familia kama muundo mnene - kumaanisha kuwa vigezo vyote bilioni 27 vinatumika wakati wa makisio - iliyoundwa kwa ajili ya mzigo wa kazi ambapo utendaji thabiti katika kazi mbalimbali

ni muhimu zaidi kuliko muundo wowote wa Open2.

Uamuzi wa Alibaba wa kuachilia Qwen 3.5 kama modeli zilizo wazi ni chaguo la kimkakati ambalo huitofautisha na mbinu zisizo wazi zinazopendekezwa na OpenAI na, kwa kiwango fulani, Anthropic. Kwa kufanya vipimo vipatikane bila malipo, Alibaba inaweka dau kuwa kupitishwa kwa mfumo wa ikolojia na uvumbuzi wa mkondo wa chini kutazalisha thamani zaidi kuliko kuweka miundo kuwa ya umiliki.

Njia hii tayari imelipa faida kwa familia ya Qwen. Matoleo ya awali ya Qwen yamekubaliwa kwa wingi katika jumuiya ya chanzo huria, yamesawazishwa vyema kwa programu maalum, na kuunganishwa katika bidhaa za kibiashara na makampuni ambayo hayawezi kumudu au kuchagua kutotegemea watoa huduma waliofungwa wa API. Kila toleo jipya huimarisha nafasi ya Alibaba kama mbadala wa ukweli wa familia ya Meta's Llama katika mfumo wa uzani huria.

Muda wa kutolewa pia ni muhimu. Hufika huku tasnia ya AI ikikabiliana na maswali kuhusu iwapo miundo iliyo wazi inaweza kwenda sambamba na mifumo iliyofungwa ya mipaka. Na Qwen 3.5, Alibaba wanafanya kesi kali kwamba wanaweza - na kwa gharama ya chini sana.

Manufaa ya Gharama na Athari za Soko

Hoja ya gharama ni msingi wa sauti ya Alibaba. Biashara zinapoongeza uwekaji wa AI kutoka kwa mifano ya majaribio hadi mifumo ya uzalishaji kuchakata mamilioni ya maombi kila siku, gharama za API kutoka kwa watoa huduma kama OpenAI na Anthropic zinaweza kupaa haraka. Miundo iliyofunguliwa inayoweza kupangishwa yenyewe huondoa gharama za kila tokeni kabisa, na kuzibadilisha na gharama zisizobadilika za miundombinu ambazo zinaongezeka kiuchumi kwa kiwango kikubwa.

Usanifu mchanganyiko wa wataalam huongeza faida hii zaidi. Kwa kuwezesha sehemu ya jumla ya vigezo kwa kila simu ya makisio, miundo ya MoE hutoa utendaji bora kwa kila dola kuliko miundo mnene ya ubora sawa. Kwa makampuni yanayoendesha mzigo wa kazi wa AI kwenye makundi ya GPU, hii hutafsiri moja kwa moja hadi mahitaji ya chini ya maunzi au uboreshaji wa juu zaidi kwenye miundombinu iliyopo.

Inamaanisha Nini kwa Mazingira ya AI

Kutolewa kwa Qwen 3.5 kunaimarisha mwelekeo ambao umekuwa ukiongezeka kwa kasi mwaka wa 2025 hadi 2026: pengo lililo wazi kati ya miundo mingi na iliyofungwa ni finyu zaidi. Ambapo miundo iliyofungwa kwenye mipaka iliwahi kuwa na uwezo wa kuongoza, njia mbadala zilizo wazi sasa ziko ndani ya umbali wa kuvutia kwenye vigezo vingi, huku zikitoa manufaa katika gharama, ubinafsishaji, na faragha ya data ambayo API zilizofungwa haziwezi kulingana.

Kwa wasanidi programu na makampuni yanayotathmini mikakati yao ya AI, familia ya Qwen 3.5 inatoa chaguo la kulazimisha la kuzingatia kwa uzito kando ya Gudenet ya Gudenet5 inayomfaa Mwana 4.5, na mfululizo wa Llama 4 wa Meta. Gharama ya uwezo wa hali ya juu wa AI inavyoendelea kushuka, shinikizo kwa watoa huduma wa programu-jalizi kuhalalisha malipo yao ya bei itaongezeka tu.

Makala haya yanatokana na kuripotiwa na The Decoder. Soma makala asili>.