ഓപ്പൺ മോഡൽ റേസിൽ പുതിയ മത്സരാർത്ഥി
Alibaba തങ്ങളുടെ ഏറ്റവും പുതിയ ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് മോഡലുകളുടെ കുടുംബമായ Qwen 3.5 സീരീസ് അനാവരണം ചെയ്തു, ഇത് ലാർജ് ലാംഗ്വേജ് മോഡൽ സ്പേസിലെ ആധിപത്യത്തിനായുള്ള ആഗോള മത്സരത്തെ തീവ്രമാക്കുന്നു. ഈ റിലീസ് നാല് വ്യത്യസ്ത മോഡലുകൾ ഉൾക്കൊള്ളുന്നു — Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, Qwen3.5-27B — ഓരോന്നും വ്യത്യസ്ത ഉപയോഗ സാഹചര്യങ്ങളെയും കമ്പ്യൂട്ടേഷണൽ ബഡ്ജറ്റുകളെയും ലക്ഷ്യമിടുന്നു, അതേസമയം കാര്യക്ഷമതയ്ക്കും പ്രകടനത്തിനും വേണ്ടി രൂപകൽപ്പന ചെയ്ത ഒരു പൊതു വാസ്തുവിദ്യ പങ്കിടുന്നു.
ചൈനീസ് ടെക് ഭീമൻ Qwen 3.5 നെ നിലവിൽ ലഭ്യമായ ഏറ്റവും കഴിവുറ്റ വാണിജ്യ മോഡലുകളായ OpenAIയുടെ GPT-5 mini, Anthropicയുടെ Claude Sonnet 4.5 എന്നിവയ്ക്ക് നേരിട്ടുള്ള എതിരാളിയായി സ്ഥാനനിർണ്ണയിക്കുന്നു. പ്രകടനത്തിൻ്റെ അവകാശവാദങ്ങൾ മാത്രമല്ല, വിലയും ഈ വെല്ലുവിളിയെ പ്രത്യേകം ആകർഷകമാക്കുന്നു: Alibabaയുടെ അഭിപ്രായത്തിൽ അവരുടെ മോഡലുകൾ കുറഞ്ഞ ചിലവിൽ താരതമ്യപ്പെടുത്താവുന്ന ഗുണമേന്മ നൽകുന്നു, ഇത് ഉയർന്ന നിലവാരമുള്ള AI കഴിവുകൾ വിശാലമായ ഡെവലപ്പർമാർക്കും എന്റർപ്രൈസുകൾക്കും ലഭ്യമാക്കുന്നു.
മോഡൽ നിര
Qwen 3.5 കുടുംബം മോഡൽ രൂപകൽപ്പനയ്ക്ക് ഒരു ശ്രേണിപരമായ സമീപനം സ്വീകരിക്കുന്നു, അൾട്രാ-ലൈറ്റ് വെയിറ്റ് ഇൻഫറൻസ് മുതൽ ഹെവി വെയിറ്റ് റീസണിംഗ് ടാസ്ക്കുകൾ വരെ ഓപ്ഷനുകൾ നൽകുന്നു. പേരിടൽ രീതി വാസ്തുവിദ്യയെ വെളിപ്പെടുത്തുന്നു: "A" കൊണ്ട് വേർതിരിച്ച രണ്ട് സംഖ്യകളുള്ള മോഡലുകൾ മിക്സ്ചർ-ഓഫ്-എക്സ്പെർട്ട്സ് (MoE) സമീപനം ഉപയോഗിക്കുന്നു, അവിടെ ഏതെങ്കിലും ഒരു ഇൻപുട്ടിന് പാരാമീറ്ററുകളുടെ ഒരു ഉപവിഭാഗം മാത്രമേ സജീവമാകൂ, ഇത് കമ്പ്യൂട്ടേഷണൽ ചെലവുകൾ ഗണ്യമായി കുറയ്ക്കുന്നു.
Qwen3.5-Flash എന്നത് വേഗത-ഒപ്റ്റിമൈസ് ചെയ്ത വേരിയൻ്റാണ്, ഇത് കുറഞ്ഞ ലേറ്റൻസിയും ഉയർന്ന ത്രൂപുട്ടും നിർണായകമായ ആപ്ലിക്കേഷനുകൾക്കായി രൂപകൽപ്പന ചെയ്തതാണ്. ചാറ്റ്ബോട്ടുകൾ, ഉള്ളടക്ക നിർമ്മാണം, സാധാരണ ഭാഷാ ടാസ്ക്കുകൾ എന്നിവയ്ക്ക് ഇത് ഒരു ചെലവ്-ഫലപ്രദമായ പരിഹാരമായി സ്ഥാന Петраയിരിക്കുന്നു, അവിടെ പരമാവധി റീസണിംഗ് ഡെപ്ത്തിനേക്കാൾ തൽക്ഷണ പ്രതികരണങ്ങൾക്ക് കൂടുതൽ പ്രാധാന്യമുണ്ട്.
Qwen3.5-35B-A3B മോഡൽ 35 ബില്യൺ മൊത്തം പാരാമീറ്ററുകളുള്ള ഒരു സ്പാർസ് MoE വാസ്തുവിദ്യ ഉപയോഗിക്കുന്നു, എന്നാൽ ഏത് സമയത്തും 3 ബില്യൺ മാത്രമേ സജീവമാകൂ. ഈ രൂപകൽപ്പന അതിൻ്റെ കമ്പ്യൂട്ടേഷണൽ ഭാരത്തേക്കാൾ വളരെ ഉയർന്ന പ്രകടനം നടത്താൻ അനുവദിക്കുന്നു, വലിയ ഡെൻസ് മോഡലുകൾക്ക് സമീപമുള്ള ഗുണമേന്മ നൽകുന്നു, അതേസമയം ഇൻഫറൻസ് കമ്പ്യൂട്ടിൻ്റെ ഒരു ചെറിയ ഭാഗം മാത്രം ആവശ്യപ്പെടുന്നു.
നിരയുടെ മുകളിൽ Qwen3.5-122B-A10B ആണ്, ഇത് 122 ബില്യൺ മൊത്തം പാരാമീറ്ററുകളും ഏകദേശം 10 ബില്യൺ സജീവ പാരാമീറ്ററുകളും ഉള്ള ഒരു വലിയ-സ്കെയിൽ മിക്സ്ചർ-ഓഫ്-എക്സ്പെർട്ട്സ് മോഡലാണ്. ഈ മോഡൽ ഏറ്റവും കൂടുതൽ ആവശ്യപ്പെടുന്ന റീസണിംഗ്, കോഡിംഗ്, വിശകലന ടാസ്ക്കുകൾ എന്നിവയെ ലക്ഷ്യമിടുന്നു, അവിടെ Alibaba ഫ്രണ്ടിയർ വാണിജ്യ മോഡലുകളുമായി മത്സരിക്കുന്ന പ്രകടനം അവകാശപ്പെടുന്നു.
Qwen3.5-27B കുടുംബത്തെ ഒരു ഡെൻസ് മോഡലായി പൂർത്തിയാക്കുന്നു — അതായത് 27 ബില്യൺ പാരാമീറ്ററുകൾ ഇൻഫറൻസിനിടയിൽ സജീവമായിരിക്കും — വിവിധ ടാസ്ക്കുകളിലുടനീളം സ്ഥിരമായ പ്രകടനം ഏതെങ്കിലും ഒരു മാനദണ്ഡത്തിൽ പരമാവധി കാര്യക്ഷമതയേക്കാൾ കൂടുതൽ പ്രധാനമായ വർക്ക്ലോഡുകൾക്കായി രൂപകൽപ്പന ചെയ്തതാണ്.
ഓപ്പൺ മോഡൽ തന്ത്രം
Qwen 3.5 നെ ഓപ്പൺ മോഡലുകളായി പുറത്തിറക്കാനുള്ള Alibabaയുടെ തീരുമാനം ഒരു തന്ത്രപരമായ തിരഞ്ഞെടുപ്പാണ്, ഇത് OpenAI, കൂടാതെ ഒരു പരിധി വരെ Anthropic എന്നിവ ഇഷ്ടപ്പെടുന്ന ക്ലോസ്ഡ്-സോഴ്സ് സമീപനങ്ങളിൽ നിന്ന് ഇതിനെ വേർതിരിക്കുന്നു. ഭാരങ്ങൾ (weights) സൗജന്യമായി ലഭ്യമാക്കുന്നതിലൂടെ, ആവാസവ്യവസ്ഥയുടെ സ്വീകാര്യതയും ഡൗൺസ്ട്രീം നൂതനത്വവും ഉടമസ്ഥാവകാശമുള്ള മോഡലുകൾ നിലനിർത്തുന്നതിനേക്കാൾ കൂടുതൽ മൂല്യം സൃഷ്ടിക്കുമെന്ന് Alibaba വാതുവെക്കുന്നു.
ഈ സമീപനം Qwen കുടുംബത്തിന് ഇതിനകം തന്നെ നേട്ടങ്ങൾ നൽകിയിട്ടുണ്ട്. മുൻ Qwen റിലീസുകൾ ഓപ്പൺ-സോഴ്സ് കമ്മ്യൂണിറ്റിയിൽ വ്യാപകമായി സ്വീകരിക്കപ്പെട്ടിട്ടുണ്ട്, പ്രത്യേക ആപ്ലിക്കേഷനുകൾക്കായി ഫൈൻ-ട്യൂൺ ചെയ്യപ്പെട്ടിട്ടുണ്ട്, കൂടാതെ ക്ലോസ്ഡ് API ദാതാക്കളെ ആശ്രയിക്കാൻ കഴിയില്ല അല്ലെങ്കിൽ തിരഞ്ഞെടുക്കാത്ത കമ്പനികൾ വാണിജ്യ ഉൽപ്പന്നങ്ങളിൽ സംയോജിപ്പിച്ചിട്ടുണ്ട്. ഓരോ പുതിയ റിലീസും ഓപ്പൺ-വെയിറ്റ്സ് ആവാസവ്യവസ്ഥയിൽ Metaയുടെ Llama കുടുംബത്തിന് ഒരു ഡി ഫാക്ടോ ബദൽ എന്ന നിലയിൽ Alibabaയുടെ സ്ഥാനം ശക്തിപ്പെടുത്തുന്നു.
റിലീസ് സമയം വളരെ പ്രധാനമാണ്. AI വ്യവസായം ഓപ്പൺ മോഡലുകൾക്ക് ക്ലോസ്ഡ് ഫ്രണ്ടിയർ സിസ്റ്റങ്ങളുമായി യഥാർത്ഥത്തിൽ വേഗത നിലനിർത്താൻ കഴിയുമോ എന്ന ചോദ്യങ്ങളുമായി മല്ലിടുമ്പോൾ ഇത് വരുന്നു. Qwen 3.5 ഉപയോഗിച്ച്, Alibaba അവയ്ക്ക് കഴിയും — വളരെ കുറഞ്ഞ ചിലവിൽ — എന്ന് ആക്രമണാത്മകമായി വാദിക്കുന്നു.
ചെലവ് പ്രയോജനം, വിപണി ഫലങ്ങൾ
ചെലവ് വാദം Alibabaയുടെ അവതരണത്തിന് കേന്ദ്രമാണ്. എന്റർപ്രൈസുകൾ അവരുടെ AI വിന്യാസങ്ങളെ പ്രായോഗിക പ്രോട്ടോടൈപ്പുകളിൽ നിന്ന് പ്രതിദിനം ദശലക്ഷക്കണക്കിന് അഭ്യർത്ഥനകൾ പ്രോസസ്സ് ചെയ്യുന്ന ഉൽപ്പാദന സംവിധാനങ്ങളിലേക്ക് വികസിപ്പിക്കുമ്പോൾ, OpenAI, Anthropic പോലുള്ള ദാതാക്കളിൽ നിന്നുള്ള API ചെലവുകൾ വേഗത്തിൽ വർദ്ധിക്കും. സ്വയം ഹോസ്റ്റ് ചെയ്യാൻ കഴിയുന്ന ഓപ്പൺ മോഡലുകൾ ഓരോ ടോക്കൺ ഫീസും പൂർണ്ണമായും നീക്കംചെയ്യുന്നു, അവയെ സ്ഥിരമായ അടിസ്ഥാന സൗകര്യ ചെലവുകൾക്ക് പകരം വയ്ക്കുന്നു, ഇത് സ്കെയിലിൽ കൂടുതൽ സാമ്പത്തികമായി മാറുന്നു.
മിക്സ്ചർ-ഓഫ്-എക്സ്പെർട്ട്സ് വാസ്തുവിദ്യ ഈ പ്രയോജനം കൂടുതൽ വർദ്ധിപ്പിക്കുന്നു. ഓരോ ഇൻഫറൻസ് കോളും മൊത്തം പാരാമീറ്ററുകളുടെ ഒരു ഭാഗം മാത്രം സജീവമാക്കുന്നതിലൂടെ, MoE മോഡലുകൾ തുല്യ ഗുണമേന്മയുള്ള ഡെൻസ് മോഡലുകളേക്കാൾ മികച്ച പ്രകടനം-പ്രതി-ഡോളർ നൽകുന്നു. GPU ക്ലസ്റ്ററുകളിൽ AI വർക്ക്ലോഡുകൾ പ്രവർത്തിപ്പിക്കുന്ന കമ്പനികൾക്ക്, ഇത് നേരിട്ട് കുറഞ്ഞ ഹാർഡ്വെയർ ആവശ്യകതകളിലേക്കോ നിലവിലുള്ള അടിസ്ഥാന സൗകര്യങ്ങളിൽ ഉയർന്ന ത്രൂപുട്ടിലേക്കോ വിവർത്തനം ചെയ്യുന്നു.
AI ലാൻഡ്സ്കേപ്പിന് ഇതിൻ്റെ അർത്ഥമെന്താണ്
Qwen 3.5 ൻ്റെ റിലീസ് 2025 ലും 2026 ലും വേഗത കൈവരിക്കുന്ന ഒരു പ്രവണതയെ ശക്തിപ്പെടുത്തുന്നു: ഓപ്പൺ, ക്ലോസ്ഡ് മോഡലുകൾക്കിടയിലുള്ള വിടവ് പലരും പ്രവചിച്ചതിലും വേഗത്തിൽ കുറയുന്നു. ഫ്രണ്ടിയർ ക്ലോസ്ഡ് മോഡലുകൾ ഒരിക്കൽ കഴിവുകളിൽ ആധിപത്യം നേടിയിരുന്നിടത്ത്, ഓപ്പൺ ബദലുകൾ ഇപ്പോൾ മിക്ക ബെഞ്ച്മാർക്കുകളിലും സമീപിക്കാവുന്ന ദൂരത്തിലാണ്, അതേസമയം ചെലവ്, ഇഷ്ടാനുസരണം, ഡാറ്റാ സ്വകാര്യത എന്നിവയിൽ പ്രയോജനങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നു, ഇത് ക്ലോസ്ഡ് API കൾക്ക് താരതമ്യം ചെയ്യാൻ കഴിയില്ല.
അവരുടെ AI തന്ത്രങ്ങൾ വിലയിരുത്തുന്ന ഡെവലപ്പർമാർക്കും എന്റർപ്രൈസുകൾക്കും, Qwen 3.5 കുടുംബം GPT-5 mini, Claude Sonnet 4.5, Metaയുടെ Llama 4 സീരീസ് എന്നിവയോടൊപ്പം ഗൗരവമായി പരിഗണിക്കാൻ യോഗ്യമായ ആകർഷകമായ ഒരു ഓപ്ഷൻ അവതരിപ്പിക്കുന്നു. അത്യാധുനിക AI കഴിവുകളുടെ ചെലവ് കുറയുന്നത് തുടരുമ്പോൾ, അവരുടെ വില പ്രീമിയം ന്യായീകരിക്കുന്നതിന് ക്ലോസ്ഡ്-സോഴ്സ് ദാതാക്കൾക്ക് മേലുള്ള സമ്മർദ്ദം വർദ്ധിക്കും.
ഈ ലേഖനം The Decoder ൻ്റെ റിപ്പോർട്ടിംഗിനെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്. യഥാർത്ഥ ലേഖനം വായിക്കുക.


