திறந்த மாதிரிப் போட்டியில் ஒரு புதிய போட்டியாளர்
Alibaba தனது சமீபத்திய செயற்கை நுண்ணறிவு மாதிரிகளின் குடும்பமான Qwen 3.5 தொடரை வெளியிட்டுள்ளது, இது பெரிய மொழி மாதிரிப் பிரிவில் ஆதிக்கத்திற்கான உலகளாவிய போட்டியைத் தீவிரப்படுத்துகிறது. இந்த வெளியீட்டில் நான்கு தனித்துவமான மாதிரிகள் உள்ளன — Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, மற்றும் Qwen3.5-27B — ஒவ்வொன்றும் வெவ்வேறு பயன்பாட்டு நிகழ்வுகள் மற்றும் கணக்கீட்டு வரவு செலவுத் திட்டங்களை இலக்காகக் கொண்டுள்ளன, அதே நேரத்தில் செயல்திறன் மற்றும் செயல்திறனுக்காக வடிவமைக்கப்பட்ட ஒரு பொதுவான கட்டமைப்பைப் பகிர்ந்து கொள்கின்றன.
சீன தொழில்நுட்ப ஜாம்பவான் Qwen 3.5-ஐ இன்று கிடைக்கக்கூடிய மிகவும் திறமையான வணிக மாதிரிகளில் சிலவற்றிற்கு, குறிப்பாக OpenAI-யின் GPT-5 mini மற்றும் Anthropic-ன் Claude Sonnet 4.5-க்கு நேரடி போட்டியாளராக நிலைநிறுத்துகிறது. செயல்திறன் கூற்றுகள் மட்டுமல்ல, விலையும் சவாலை குறிப்பாக கவர்ச்சிகரமானதாக ஆக்குகிறது: Alibaba அதன் மாதிரிகள் குறைந்த செலவில் ஒப்பிடக்கூடிய தரத்தை வழங்குவதாகக் கூறுகிறது, இது உயர்நிலை AI திறன்களை டெவலப்பர்கள் மற்றும் நிறுவனங்களின் பரந்த அளவிலானவர்களுக்கு அணுகக்கூடியதாக மாற்றுகிறது.
மாதிரி வரிசை
Qwen 3.5 குடும்பம் மாதிரி வடிவமைப்பிற்கு ஒரு அடுக்கு அணுகுமுறையை எடுக்கிறது, இது அதி-இலகுரக அனுமானம் முதல் கடினமான பகுத்தறிவு பணிகள் வரை உள்ள விருப்பங்களை வழங்குகிறது. பெயரிடும் மரபு கட்டமைப்பை வெளிப்படுத்துகிறது: "A" ஆல் பிரிக்கப்பட்ட இரண்டு எண்களைக் கொண்ட மாதிரிகள் கலவை-நிபுணர் (MoE) அணுகுமுறையைப் பயன்படுத்துகின்றன, இதில் எந்தவொரு உள்ளீட்டிற்கும் அளவுருக்களின் ஒரு துணைக்குழு மட்டுமே செயல்படுகிறது, இது கணக்கீட்டு செலவுகளை வியத்தகு முறையில் குறைக்கிறது.
Qwen3.5-Flash என்பது வேக-மேம்படுத்தப்பட்ட வகையாகும், இது குறைந்த தாமதம் மற்றும் அதிக செயல்திறன் முக்கியமான பயன்பாடுகளுக்காக வடிவமைக்கப்பட்டுள்ளது. இது சாட்போட்கள், உள்ளடக்க உருவாக்கம் மற்றும் அதிகபட்ச பகுத்தறிவு ஆழத்தை விட உடனடி பதில்கள் அதிக முக்கியத்துவம் வாய்ந்த வழக்கமான மொழி பணிகளுக்கான செலவு குறைந்த தீர்வாக நிலைநிறுத்தப்பட்டுள்ளது.
Qwen3.5-35B-A3B மாதிரி 35 பில்லியன் மொத்த அளவுருக்களுடன் ஒரு சிதறிய MoE கட்டமைப்பைப் பயன்படுத்துகிறது, ஆனால் எந்த நேரத்திலும் 3 பில்லியன் மட்டுமே செயலில் உள்ளது. இந்த வடிவமைப்பு அதன் கணக்கீட்டு எடை வகுப்பை விட அதிகமாக செயல்பட அனுமதிக்கிறது, இது கணிசமான அளவு கணக்கீட்டு செலவைக் கோரும் அதே நேரத்தில் மிகவும் பெரிய அடர்த்தியான மாதிரிகளை நெருங்கும் தரத்தை வழங்குகிறது.
வரிசையின் உச்சியில் Qwen3.5-122B-A10B உள்ளது, இது 122 பில்லியன் மொத்த அளவுருக்கள் மற்றும் சுமார் 10 பில்லியன் செயலில் உள்ள அளவுருக்களுடன் ஒரு பெரிய அளவிலான கலவை-நிபுணர் மாதிரி ஆகும். இந்த மாதிரி மிகவும் கடினமான பகுத்தறிவு, குறியீட்டு மற்றும் பகுப்பாய்வு பணிகளை இலக்காகக் கொண்டுள்ளது, அங்கு Alibaba முன்னணி வணிக மாதிரிகளுடன் போட்டியிடும் செயல்திறனைக் கூறுவதாகக் கூறுகிறது.
Qwen3.5-27B ஒரு அடர்த்தியான மாதிரியாக குடும்பத்தை நிறைவு செய்கிறது — அதாவது அனுமானத்தின் போது அனைத்து 27 பில்லியன் அளவுருக்களும் செயலில் உள்ளன — இது எந்தவொரு ஒற்றை பரிமாணத்திலும் அதிகபட்ச செயல்திறனை விட பல்வேறு பணிகளில் நிலையான செயல்திறன் முக்கியமானது.
திறந்த மாதிரி உத்தி
Alibaba-வின் Qwen 3.5-ஐ திறந்த மாதிரிகளாக வெளியிடும் முடிவு ஒரு மூலோபாய தேர்வாகும், இது OpenAI மற்றும், ஒரு குறிப்பிட்ட அளவிற்கு, Anthropic விரும்பும் மூடிய மூல அணுகுமுறைகளிலிருந்து வேறுபடுத்துகிறது. எடைகளை இலவசமாகக் கிடைக்கச் செய்வதன் மூலம், Alibaba சுற்றுச்சூழல் அமைப்பு தத்தெடுப்பு மற்றும் கீழ்நிலை கண்டுபிடிப்புகள் தனியுரிம மாதிரிகளை வைத்திருப்பதை விட அதிக மதிப்பை உருவாக்கும் என்று பந்தயம் கட்டுகிறது.
இந்த அணுகுமுறை ஏற்கனவே Qwen குடும்பத்திற்கு பலன் அளித்துள்ளது. முந்தைய Qwen வெளியீடுகள் திறந்த மூல சமூகத்தில் பரவலாக ஏற்றுக்கொள்ளப்பட்டுள்ளன, சிறப்பு பயன்பாடுகளுக்காக நன்றாகச் சரிசெய்யப்பட்டுள்ளன, மேலும் மூடப்பட்ட API வழங்குநர்களை வாங்க முடியாத அல்லது நம்ப விரும்பாத நிறுவனங்களால் வணிகத் தயாரிப்புகளில் ஒருங்கிணைக்கப்பட்டுள்ளன. ஒவ்வொரு புதிய வெளியீடும் திறந்த-எடை சுற்றுச்சூழல் அமைப்பில் Meta-வின் Llama குடும்பத்திற்கு மாற்று என Alibaba-வின் நிலையை வலுப்படுத்துகிறது.
வெளியீட்டின் நேரம் முக்கியமானது. AI தொழில் திறந்த மாதிரிகள் மூடிய முன்னணி அமைப்புகளுடன் உண்மையிலேயே வேகத்தை பராமரிக்க முடியுமா என்ற கேள்விகளுடன் போராடும்போது இது வருகிறது. Qwen 3.5 உடன், Alibaba அவை முடியும் — மற்றும் வியத்தகு முறையில் குறைந்த செலவில் — ஒரு ஆக்கிரோஷமான வாதத்தை முன்வைக்கிறது.
செலவு நன்மை மற்றும் சந்தை தாக்கங்கள்
செலவு வாதம் Alibaba-வின் முன்மொழிவின் மையமாகும். நிறுவனங்கள் தங்கள் AI வரிசைப்படுத்தல்களை சோதனை முன்மாதிரிகளிலிருந்து தினசரி மில்லியன் கணக்கான கோரிக்கைகளைச் செயல்படுத்தும் உற்பத்தி அமைப்புகளுக்கு அளவிடும்போது, OpenAI மற்றும் Anthropic போன்ற வழங்குநர்களிடமிருந்து API செலவுகள் விரைவாக உயரக்கூடும். சுய-ஹோஸ்ட் செய்யக்கூடிய திறந்த மாதிரிகள் டோக்கன்-க்கு-டோக்கன் கட்டணங்களை முழுமையாக நீக்குகின்றன, அவற்றை நிலையான உள்கட்டமைப்பு செலவுகளுடன் மாற்றுகின்றன, இது பெரிய அளவில் மேலும் மேலும் சிக்கனமானதாகிறது.
கலவை-நிபுணர் கட்டமைப்பு இந்த நன்மையை மேலும் அதிகரிக்கிறது. ஒவ்வொரு அனுமான அழைப்பிற்கும் மொத்த அளவுருக்களின் ஒரு பகுதியை மட்டுமே செயல்படுத்துவதன் மூலம், MoE மாதிரிகள் சமமான தரத்தின் அடர்த்தியான மாதிரிகளை விட ஒரு டாலருக்கு சிறந்த செயல்திறனை வழங்குகின்றன. GPU கிளஸ்டர்களில் AI பணிச்சுமைகளை இயக்கும் நிறுவனங்களுக்கு, இது தற்போதுள்ள உள்கட்டமைப்பில் குறைந்த வன்பொருள் தேவைகள் அல்லது அதிக செயல்திறனாக நேரடியாக மொழிபெயர்க்கிறது.
AI நிலப்பரப்பிற்கு இது என்ன அர்த்தம்
Qwen 3.5-ன் வெளியீடு 2025 மற்றும் 2026 முழுவதும் விரைவாகி வரும் ஒரு போக்கை வலுப்படுத்துகிறது: திறந்த மற்றும் மூடிய மாதிரிகளுக்கு இடையிலான இடைவெளி பலர் கணித்ததை விட வேகமாக குறைகிறது. முன்னணி மூடிய மாதிரிகள் ஒரு காலத்தில் திறனில் ஒரு ஆதிக்க முன்னணியைக் கொண்டிருந்தன, திறந்த மாற்றுகள் இப்போது பெரும்பாலான அளவுகோல்களில் தாக்குதல் வரம்பிற்குள் உள்ளன, அதே நேரத்தில் செலவு, தனிப்பயனாக்கம் மற்றும் தரவு தனியுரிமை ஆகியவற்றில் மூடிய API-களால் பொருந்தாத நன்மைகளை வழங்குகின்றன.
டெவலப்பர்கள் மற்றும் நிறுவனங்கள் தங்கள் AI உத்திகளை மதிப்பீடு செய்யும்போது, Qwen 3.5 குடும்பம் GPT-5 mini, Claude Sonnet 4.5 மற்றும் Meta-வின் Llama 4 தொடருடன் தீவிர பரிசீலனைக்கு தகுதியான ஒரு கவர்ச்சிகரமான விருப்பத்தை வழங்குகிறது. அதிநவீன AI திறன்களின் செலவு தொடர்ந்து குறைந்து வருவதால், மூடிய மூல வழங்குநர்கள் தங்கள் விலை பிரீமியத்தை நியாயப்படுத்த வேண்டிய அழுத்தம் அதிகரிக்கும்.
இந்த கட்டுரை The Decoder-ன் அறிக்கையை அடிப்படையாகக் கொண்டது. அசல் கட்டுரையைப் படிக்கவும்.


