ઓપન મોડેલ રેસમાં નવો દાવેદાર
Alibaba એ તેના નવીનતમ આર્ટિફિશિયલ ઇન્ટેલિજન્સ મોડેલ્સ, Qwen 3.5 સિરીઝનું અનાવરણ કર્યું છે, જે લાર્જ લેંગ્વેજ મોડેલ સ્પેસમાં પ્રભુત્વ માટે વૈશ્વિક સ્પર્ધાને તીવ્ર બનાવે છે. આ રિલીઝમાં ચાર અલગ-અલગ મોડેલ્સનો સમાવેશ થાય છે — Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, અને Qwen3.5-27B — દરેક વિવિધ ઉપયોગના કેસો અને ગણતરીના બજેટને લક્ષ્ય બનાવે છે, જ્યારે કાર્યક્ષમતા અને પ્રદર્શન માટે રચાયેલ સામાન્ય આર્કિટેક્ચર શેર કરે છે.
ચાઇનીઝ ટેક જાયન્ટ Qwen 3.5 ને હાલમાં ઉપલબ્ધ સૌથી સક્ષમ કોમર્શિયલ મોડેલ્સ પૈકીના કેટલાક, ખાસ કરીને OpenAI ના GPT-5 mini અને Anthropic ના Claude Sonnet 4.5, ને સીધા સ્પર્ધક તરીકે સ્થાન આપી રહ્યું છે. જે બાબત આ પડકારને ખાસ કરીને આકર્ષક બનાવે છે તે માત્ર પ્રદર્શનના દાવા નથી, પરંતુ કિંમત પણ છે: Alibaba કહે છે કે તેમના મોડેલ્સ ઓછી કિંમતે તુલનાત્મક ગુણવત્તા પ્રદાન કરે છે, જે ઉચ્ચ-સ્તરની AI ક્ષમતાઓને વિશાળ શ્રેણીના ડેવલપર્સ અને એન્ટરપ્રાઇઝ માટે સુલભ બનાવે છે.
મોડેલ લાઇનઅપ
Qwen 3.5 કુટુંબ મોડેલ ડિઝાઇન માટે એક સ્તરીય અભિગમ અપનાવે છે, જે અલ્ટ્રા-લાઇટવેઇટ ઇન્ફરન્સથી લઈને હેવીવેઇટ રિઝનિંગ કાર્યો સુધીના વિકલ્પો પ્રદાન કરે છે. નામકરણ પદ્ધતિ આર્કિટેક્ચરને જાહેર કરે છે: "A" દ્વારા અલગ કરાયેલા બે નંબરોવાળા મોડેલ્સ મિક્સચર-ઓફ-એક્સપર્ટ્સ (MoE) અભિગમનો ઉપયોગ કરે છે, જ્યાં કોઈપણ આપેલ ઇનપુટ માટે ફક્ત પેરામીટર્સનો એક પેટા-સમૂહ સક્રિય થાય છે, જે ગણતરીના ખર્ચમાં નોંધપાત્ર ઘટાડો કરે છે.
Qwen3.5-Flash એ સ્પીડ-ઓપ્ટિમાઇઝ્ડ વેરિઅન્ટ છે, જે એવી એપ્લિકેશન્સ માટે ડિઝાઇન કરાયેલ છે જ્યાં ઓછી લેટન્સી અને ઉચ્ચ થ્રુપુટ નિર્ણાયક છે. તે ચેટબોટ્સ, કન્ટેન્ટ જનરેશન અને નિયમિત ભાષા કાર્યો માટે ખર્ચ-અસરકારક ઉકેલ તરીકે સ્થાન પામ્યું છે જ્યાં મહત્તમ રિઝનિંગ ડેપ્થ કરતાં લગભગ તાત્કાલિક પ્રતિસાદ વધુ મહત્વપૂર્ણ છે.
Qwen3.5-35B-A3B મોડેલ 35 બિલિયન કુલ પેરામીટર્સ સાથે સ્પાર્સ MoE આર્કિટેક્ચરનો ઉપયોગ કરે છે પરંતુ કોઈપણ સમયે ફક્ત 3 બિલિયન સક્રિય હોય છે. આ ડિઝાઇન તેને તેના ગણતરીના વજન વર્ગ કરતાં વધુ સારું પ્રદર્શન કરવા દે છે, ઘણા મોટા ડેન્સ મોડેલ્સની નજીકની ગુણવત્તા પ્રદાન કરે છે જ્યારે ઇન્ફરન્સ કોમ્પ્યુટનો એક અંશ જરૂરી છે.
લાઇનઅપની ટોચ પર Qwen3.5-122B-A10B છે, જે 122 બિલિયન કુલ પેરામીટર્સ અને આશરે 10 બિલિયન સક્રિય પેરામીટર્સ સાથેનું એક મોટું-સ્તરનું મિક્સચર-ઓફ-એક્સપર્ટ્સ મોડેલ છે. આ મોડેલ સૌથી વધુ માંગવાળા રિઝનિંગ, કોડિંગ અને વિશ્લેષણાત્મક કાર્યોને લક્ષ્ય બનાવે છે, જ્યાં Alibaba ફ્રન્ટિયર કોમર્શિયલ મોડેલ્સ સાથે સ્પર્ધાત્મક પ્રદર્શનનો દાવો કરે છે.
Qwen3.5-27B એ ડેન્સ મોડેલ તરીકે કુટુંબને પૂર્ણ કરે છે — એટલે કે 27 બિલિયન પેરામીટર્સ ઇન્ફરન્સ દરમિયાન સક્રિય હોય છે — એવા વર્કલોડ્સ માટે ડિઝાઇન કરાયેલ છે જ્યાં વિવિધ કાર્યોમાં સુસંગત પ્રદર્શન કોઈપણ એક પરિમાણ પર મહત્તમ કાર્યક્ષમતા કરતાં વધુ મહત્વપૂર્ણ છે.
ઓપન મોડેલ વ્યૂહરચના
Qwen 3.5 ને ઓપન મોડેલ્સ તરીકે રિલીઝ કરવાનો Alibaba નો નિર્ણય એક વ્યૂહાત્મક પસંદગી છે જે તેને OpenAI અને, અમુક અંશે, Anthropic દ્વારા પસંદ કરાયેલા ક્લોઝ્ડ-સોર્સ અભિગમોથી અલગ પાડે છે. વેઇટ્સ (weights) મફતમાં ઉપલબ્ધ કરાવીને, Alibaba દાવ લગાવી રહ્યું છે કે ઇકોસિસ્ટમનો સ્વીકાર અને ડાઉનસ્ટ્રીમ નવીનતા માલિકીના મોડેલ્સ રાખવા કરતાં વધુ મૂલ્ય બનાવશે.
આ અભિગમે Qwen કુટુંબ માટે પહેલેથી જ ફાયદાઓ આપ્યા છે. અગાઉના Qwen રિલીઝ ઓપન-સોર્સ સમુદાયમાં વ્યાપકપણે અપનાવવામાં આવ્યા છે, વિશિષ્ટ એપ્લિકેશન્સ માટે ફાઇન-ટ્યુન કરવામાં આવ્યા છે, અને એવી કંપનીઓ દ્વારા કોમર્શિયલ પ્રોડક્ટ્સમાં એકીકૃત કરવામાં આવ્યા છે જેઓ ક્લોઝ્ડ API પ્રદાતાઓ પર આધાર રાખવા પરવડી શકતા નથી અથવા પસંદ કરતા નથી. દરેક નવો રિલીઝ ઓપન-વેઇટ્સ ઇકોસિસ્ટમમાં Meta ના Llama કુટુંબ માટે ડિ ફેક્ટો વિકલ્પ તરીકે Alibaba ની સ્થિતિને મજબૂત બનાવે છે.
રિલીઝનો સમય પણ મહત્વપૂર્ણ છે. તે AI ઉદ્યોગ એવા પ્રશ્નો સાથે સંઘર્ષ કરી રહ્યો છે કે શું ઓપન મોડેલ્સ ખરેખર ક્લોઝ્ડ ફ્રન્ટિયર સિસ્ટમ્સ સાથે તાલ મિલાવી શકે છે. Qwen 3.5 સાથે, Alibaba આક્રમક રીતે દાવો કરી રહ્યું છે કે તેઓ કરી શકે છે — અને નોંધપાત્ર રીતે ઓછી કિંમતે.
ખર્ચ લાભ અને બજાર અસરો
ખર્ચનો દલીલ Alibaba ના પિચ માટે કેન્દ્રિય છે. જેમ જેમ એન્ટરપ્રાઇઝ તેમના AI ડિપ્લોયમેન્ટ્સને પ્રાયોગિક પ્રોટોટાઇપ્સથી લઈને દરરોજ લાખો વિનંતીઓ પર પ્રક્રિયા કરતી ઉત્પાદન સિસ્ટમ્સ સુધી સ્કેલ કરે છે, તેમ તેમ OpenAI અને Anthropic જેવા પ્રદાતાઓ પાસેથી API ખર્ચ ઝડપથી વધી શકે છે. સેલ્ફ-હોસ્ટ કરી શકાય તેવા ઓપન મોડેલ્સ પ્રતિ-ટોકન શુલ્કને સંપૂર્ણપણે દૂર કરે છે, તેમને નિશ્ચિત ઇન્ફ્રાસ્ટ્રક્ચર ખર્ચ સાથે બદલીને જે સ્કેલ પર વધુ આર્થિક બને છે.
મિક્સચર-ઓફ-એક્સપર્ટ્સ આર્કિટેક્ચર આ લાભને વધુ વધારે છે. પ્રતિ ઇન્ફરન્સ કોલ કુલ પેરામીટર્સના માત્ર એક અંશને સક્રિય કરીને, MoE મોડેલ્સ સમાન ગુણવત્તાવાળા ડેન્સ મોડેલ્સ કરતાં વધુ સારું પ્રદર્શન-પ્રતિ-ડોલર પ્રદાન કરે છે. GPU ક્લસ્ટર્સ પર AI વર્કલોડ ચલાવતી કંપનીઓ માટે, આ સીધા ઓછા હાર્ડવેર આવશ્યકતાઓ અથવા હાલના ઇન્ફ્રાસ્ટ્રક્ચર પર ઉચ્ચ થ્રુપુટમાં રૂપાંતરિત થાય છે.
AI લેન્ડસ્કેપ માટે તેનો અર્થ શું છે
Qwen 3.5 નું રિલીઝ 2025 અને 2026 દરમિયાન વેગ પકડી રહેલા એક ટ્રેન્ડને મજબૂત બનાવે છે: ઓપન અને ક્લોઝ્ડ મોડેલ્સ વચ્ચેનું અંતર ઘણા લોકોની આગાહી કરતાં વધુ ઝડપથી ઘટી રહ્યું છે. જ્યાં ફ્રન્ટિયર ક્લોઝ્ડ મોડેલ્સે એક સમયે ક્ષમતામાં પ્રભુત્વ મેળવ્યું હતું, ત્યાં ઓપન વિકલ્પો હવે મોટાભાગના બેન્ચમાર્ક્સ પર સ્ટ્રાઇકિંગ અંતરે છે, જ્યારે ખર્ચ, કસ્ટમાઇઝેશન અને ડેટા ગોપનીયતામાં ફાયદા પ્રદાન કરે છે જે ક્લોઝ્ડ API મેચ કરી શકતા નથી.
તેમની AI વ્યૂહરચનાઓનું મૂલ્યાંકન કરતા ડેવલપર્સ અને એન્ટરપ્રાઇઝ માટે, Qwen 3.5 કુટુંબ GPT-5 mini, Claude Sonnet 4.5, અને Meta ના Llama 4 સિરીઝ સાથે ગંભીર વિચારણાને પાત્ર એક આકર્ષક વિકલ્પ રજૂ કરે છે. જેમ જેમ અત્યાધુનિક AI ક્ષમતાઓની કિંમત ઘટતી રહે છે, તેમ તેમ તેમના કિંમત પ્રીમિયમને ન્યાયી ઠેરવવા માટે ક્લોઝ્ડ-સોર્સ પ્રદાતાઓ પરનું દબાણ વધશે.
આ લેખ The Decoder ના રિપોર્ટિંગ પર આધારિત છે. મૂળ લેખ વાંચો.


