ओपन मॉडेल शर्यतीत नवा दावेदार
Alibaba ने आपल्या नवीनतम आर्टिफिशियल इंटेलिजन्स मॉडेल्सची फॅमिली, Qwen 3.5 सिरीज सादर केली आहे, ज्यामुळे लार्ज लँग्वेज मॉडेल स्पेसमध्ये वर्चस्वासाठी जागतिक स्पर्धा तीव्र झाली आहे. या रिलीझमध्ये चार भिन्न मॉडेल्स समाविष्ट आहेत — Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, आणि Qwen3.5-27B — प्रत्येक मॉडेल विविध वापर प्रकरणे आणि संगणकीय बजेट्सना लक्ष्य करते, तरीही कार्यक्षमता आणि कामगिरीसाठी डिझाइन केलेले एक सामान्य आर्किटेक्चर सामायिक करते.
चिनी टेक जायंट Qwen 3.5 ला सध्या उपलब्ध असलेल्या सर्वात सक्षम व्यावसायिक मॉडेल्सपैकी काही, विशेषतः OpenAI चे GPT-5 mini आणि Anthropic चे Claude Sonnet 4.5, यांना थेट स्पर्धक म्हणून स्थान देत आहे. केवळ कामगिरीचे दावेच नव्हे, तर किंमत देखील या आव्हानाला विशेषतः आकर्षक बनवते: Alibaba म्हणते की त्यांची मॉडेल्स कमी खर्चात तुलनात्मक गुणवत्ता देतात, ज्यामुळे उच्च-स्तरीय AI क्षमता विस्तृत श्रेणीतील डेव्हलपर्स आणि एंटरप्रायझेससाठी उपलब्ध होतात.
मॉडेल लाइनअप
Qwen 3.5 फॅमिली मॉडेल डिझाइनसाठी एक श्रेणीबद्ध दृष्टिकोन स्वीकारते, अल्ट्रा-लाइटवेट इन्फरन्सपासून हेवीवेट रिझनिंग कार्यांपर्यंत पर्याय देते. नावांची पद्धत आर्किटेक्चर उघड करते: "A" ने विभक्त केलेल्या दोन संख्या असलेली मॉडेल्स मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) दृष्टिकोन वापरतात, जिथे कोणत्याही दिलेल्या इनपुटसाठी पॅरामीटर्सचा केवळ एक उपसंच सक्रिय होतो, ज्यामुळे संगणकीय खर्च लक्षणीयरीत्या कमी होतो.
Qwen3.5-Flash हे स्पीड-ऑप्टिमाइझ केलेले व्हेरिएंट आहे, जे कमी लेटन्सी आणि उच्च थ्रूपुट महत्त्वपूर्ण असलेल्या ऍप्लिकेशन्ससाठी डिझाइन केलेले आहे. हे चॅटबॉट्स, कंटेंट जनरेशन आणि नियमित भाषिक कार्यांसाठी एक किफायतशीर उपाय म्हणून स्थानबद्ध केले आहे, जिथे त्वरित प्रतिसाद कमाल रिझनिंग डेप्थपेक्षा अधिक महत्त्वाचे आहेत.
Qwen3.5-35B-A3B मॉडेल 35 अब्ज एकूण पॅरामीटर्ससह एक स्पार्स MoE आर्किटेक्चर वापरते, परंतु कोणत्याही वेळी फक्त 3 अब्ज सक्रिय असतात. हे डिझाइन त्याला त्याच्या संगणकीय वजन वर्गापेक्षा खूप जास्त कामगिरी करण्यास अनुमती देते, खूप मोठ्या डेन्स मॉडेल्सच्या जवळची गुणवत्ता प्रदान करते, तरीही इन्फरन्स कॉम्प्युटचा एक अंश आवश्यक आहे.
लाइनअपच्या शीर्षस्थानी Qwen3.5-122B-A10B आहे, जे 122 अब्ज एकूण पॅरामीटर्स आणि अंदाजे 10 अब्ज सक्रिय पॅरामीटर्स असलेले एक मोठे-स्तरीय मिक्सचर-ऑफ-एक्सपर्ट्स मॉडेल आहे. हे मॉडेल सर्वात मागणी असलेल्या रिझनिंग, कोडिंग आणि विश्लेषणात्मक कार्यांना लक्ष्य करते, जिथे Alibaba फ्रंटियर व्यावसायिक मॉडेल्सशी स्पर्धात्मक कामगिरीचा दावा करते.
Qwen3.5-27B हे फॅमिलीला एक डेन्स मॉडेल म्हणून पूर्ण करते — याचा अर्थ 27 अब्ज पॅरामीटर्स इन्फरन्स दरम्यान सक्रिय असतात — जे अशा वर्कलोड्ससाठी डिझाइन केलेले आहे जिथे विविध कार्यांमध्ये सातत्यपूर्ण कामगिरी कोणत्याही एका आयामावर कमाल कार्यक्षमतेपेक्षा अधिक महत्त्वाची आहे.
ओपन मॉडेल स्ट्रॅटेजी
Qwen 3.5 ओपन मॉडेल्स म्हणून रिलीज करण्याचा Alibaba चा निर्णय एक धोरणात्मक निवड आहे जी त्याला OpenAI आणि काही प्रमाणात Anthropic द्वारे पसंत केलेल्या क्लोज्ड-सोर्स दृष्टिकोनांपासून वेगळे करते. वेट्स (weights) विनामूल्य उपलब्ध करून, Alibaba असा अंदाज लावत आहे की इकोसिस्टमचा स्वीकार आणि डाउनस्ट्रीम नवकल्पना मालकीचे मॉडेल्स ठेवण्यापेक्षा अधिक मूल्य निर्माण करेल.
या दृष्टिकोनाने Qwen फॅमिलीसाठी आधीच फायदे मिळवून दिले आहेत. मागील Qwen रिलीझ ओपन-सोर्स समुदायामध्ये मोठ्या प्रमाणावर स्वीकारले गेले आहेत, विशेष ऍप्लिकेशन्ससाठी फाइन-ट्यून केले गेले आहेत आणि कंपन्यांनी व्यावसायिक उत्पादनांमध्ये समाकलित केले आहेत ज्या एकतर परवडत नाहीत किंवा क्लोज्ड API प्रदात्यांवर अवलंबून राहणे निवडत नाहीत. प्रत्येक नवीन रिलीझ ओपन-वेट्स इकोसिस्टममध्ये Meta च्या Llama फॅमिलीसाठी डी फॅक्टो पर्यायी म्हणून Alibaba चे स्थान मजबूत करते.
रिलीजची वेळ देखील महत्त्वपूर्ण आहे. AI उद्योग ओपन मॉडेल्स खरोखर क्लोज्ड फ्रंटियर सिस्टीमच्या बरोबरीने चालू शकतात की नाही या प्रश्नांशी झगडत असताना हे घडते. Qwen 3.5 सह, Alibaba आक्रमकपणे असा दावा करत आहे की ते करू शकतात — आणि लक्षणीयरीत्या कमी खर्चात.
खर्च लाभ आणि बाजारपेठेतील परिणाम
खर्चाचा युक्तिवाद Alibaba च्या पिचचा केंद्रबिंदू आहे. जसे की एंटरप्रायझेस त्यांच्या AI डिप्लॉयमेंट्सना प्रायोगिक प्रोटोटाइपपासून दररोज लाखो विनंत्यांवर प्रक्रिया करणाऱ्या उत्पादन प्रणालींपर्यंत स्केल करतात, OpenAI आणि Anthropic सारख्या प्रदात्यांकडून API खर्च वेगाने वाढू शकतो. सेल्फ-होस्ट केले जाऊ शकणारे ओपन मॉडेल्स प्रति-टोकन शुल्क पूर्णपणे काढून टाकतात, त्यांना निश्चित पायाभूत सुविधा खर्चांनी बदलतात जे स्केलवर अधिक किफायतशीर बनतात.
मिक्सचर-ऑफ-एक्सपर्ट्स आर्किटेक्चर हा फायदा आणखी वाढवते. प्रति इन्फरन्स कॉल एकूण पॅरामीटर्सचा केवळ एक अंश सक्रिय करून, MoE मॉडेल्स समान गुणवत्तेच्या डेन्स मॉडेल्सपेक्षा प्रति-डॉलर चांगली कामगिरी देतात. GPU क्लस्टर्सवर AI वर्कलोड्स चालवणाऱ्या कंपन्यांसाठी, हे थेट कमी हार्डवेअर आवश्यकता किंवा विद्यमान पायाभूत सुविधांवर उच्च थ्रूपुटमध्ये रूपांतरित होते.
AI लँडस्केपसाठी याचा अर्थ काय
Qwen 3.5 ची रिलीज 2025 आणि 2026 मध्ये वेगवान होत असलेल्या एका ट्रेंडला बळकट करते: ओपन आणि क्लोज्ड मॉडेल्समधील अंतर अनेकांनी भाकीत केले त्यापेक्षा वेगाने कमी होत आहे. जिथे फ्रंटियर क्लोज्ड मॉडेल्स एकेकाळी क्षमतेत वर्चस्व मिळवत होते, तिथे ओपन पर्याय आता बहुतेक बेंचमार्क्सवर स्ट्राइकिंग अंतरावर आहेत, तर खर्च, कस्टमायझेशन आणि डेटा गोपनीयतेमध्ये फायदे देतात जे क्लोज्ड API जुळवू शकत नाहीत.
त्यांच्या AI स्ट्रॅटेजीजचे मूल्यांकन करणाऱ्या डेव्हलपर्स आणि एंटरप्रायझेससाठी, Qwen 3.5 फॅमिली GPT-5 mini, Claude Sonnet 4.5, आणि Meta च्या Llama 4 सिरीजसह गंभीर विचारांना पात्र असलेला एक आकर्षक पर्याय सादर करते. अत्याधुनिक AI क्षमतांचा खर्च कमी होत राहिल्याने, त्यांच्या किंमती प्रीमियमचे समर्थन करण्यासाठी क्लोज्ड-सोर्स प्रदात्यांवरील दबाव वाढेल.
हा लेख The Decoder च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.


