ওপেন মডেল রেসে এক নতুন প্রতিযোগী

Alibaba তাদের সর্বশেষ কৃত্রিম বুদ্ধিমত্তা মডেল, Qwen 3.5 সিরিজ উন্মোচন করেছে, যা বৃহৎ ভাষা মডেলের ক্ষেত্রে আধিপত্যের জন্য বিশ্বব্যাপী প্রতিযোগিতাকে তীব্রতর করেছে। এই রিলিজটিতে চারটি স্বতন্ত্র মডেল রয়েছে — Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, এবং Qwen3.5-27B — প্রতিটি বিভিন্ন ব্যবহারের ক্ষেত্রে এবং কম্পিউটেশনাল বাজেটকে লক্ষ্য করে তৈরি করা হয়েছে, যখন দক্ষতা এবং কর্মক্ষমতার জন্য ডিজাইন করা একটি সাধারণ আর্কিটেকচার ভাগ করে নেয়।

চীনা টেক জায়ান্ট Qwen 3.5 কে বর্তমানে উপলব্ধ সবচেয়ে সক্ষম বাণিজ্যিক মডেলগুলির মধ্যে কিছু, বিশেষ করে OpenAI-এর GPT-5 mini এবং Anthropic-এর Claude Sonnet 4.5-এর সরাসরি প্রতিযোগী হিসাবে স্থাপন করছে। যা চ্যালেঞ্জটিকে বিশেষভাবে আকর্ষণীয় করে তোলে তা কেবল কর্মক্ষমতার দাবি নয়, দামের বিষয়টিও: Alibaba বলছে যে তাদের মডেলগুলি অনেক কম খরচে তুলনামূলক গুণমান সরবরাহ করে, যা উচ্চ-স্তরের AI ক্ষমতাগুলিকে ডেভেলপার এবং উদ্যোগগুলির একটি অনেক বিস্তৃত পরিসরের জন্য অ্যাক্সেসযোগ্য করে তোলে।

মডেলের তালিকা

Qwen 3.5 পরিবার মডেল ডিজাইনের জন্য একটি স্তরযুক্ত পদ্ধতি গ্রহণ করে, যা আল্ট্রা-লাইটওয়েট ইনফারেন্স থেকে শুরু করে হেভিওয়েট রিজনিং টাস্ক পর্যন্ত বিকল্পগুলি সরবরাহ করে। নামকরণের রীতি আর্কিটেকচার প্রকাশ করে: "A" দ্বারা পৃথক করা দুটি সংখ্যা সহ মডেলগুলি একটি মিক্সচার-অফ-এক্সপার্টস (MoE) পদ্ধতি ব্যবহার করে, যেখানে কোনও প্রদত্ত ইনপুটের জন্য প্যারামিটারের একটি উপসেট সক্রিয় হয়, যা কম্পিউটেশনাল খরচকে উল্লেখযোগ্যভাবে হ্রাস করে।

Qwen3.5-Flash হল গতি-অপ্টিমাইজড ভ্যারিয়েন্ট, যা সেই অ্যাপ্লিকেশনগুলির জন্য ডিজাইন করা হয়েছে যেখানে কম লেটেন্সি এবং উচ্চ থ্রুপুট গুরুত্বপূর্ণ। এটি চ্যাটবট, কন্টেন্ট জেনারেশন এবং রুটিন ভাষা কাজের জন্য একটি সাশ্রয়ী সমাধান হিসাবে স্থাপন করা হয়েছে যেখানে সর্বোচ্চ রিজনিং ডেপথের চেয়ে প্রায় তাত্ক্ষণিক প্রতিক্রিয়া বেশি গুরুত্বপূর্ণ।

Qwen3.5-35B-A3B মডেলটি একটি স্পার্স MoE আর্কিটেকচার ব্যবহার করে যেখানে মোট 35 বিলিয়ন প্যারামিটার রয়েছে কিন্তু যেকোনো সময়ে মাত্র 3 বিলিয়ন সক্রিয় থাকে। এই ডিজাইনটি এটিকে এর কম্পিউটেশনাল ওয়েট ক্লাসের চেয়ে অনেক উপরে পারফর্ম করতে দেয়, যা অনেক বড় ডেন্স মডেলের কাছাকাছি গুণমান সরবরাহ করে যখন ইনফারেন্স কম্পিউটের একটি ভগ্নাংশ প্রয়োজন হয়।

লাইনাপের শীর্ষে রয়েছে Qwen3.5-122B-A10B, যা 122 বিলিয়ন মোট প্যারামিটার এবং প্রায় 10 বিলিয়ন সক্রিয় প্যারামিটার সহ একটি বৃহৎ-স্কেল মিক্সচার-অফ-এক্সপার্টস মডেল। এই মডেলটি সবচেয়ে চাহিদাপূর্ণ রিজনিং, কোডিং এবং বিশ্লেষণাত্মক কাজগুলিকে লক্ষ্য করে, যেখানে Alibaba দাবি করে যে কর্মক্ষমতা ফ্রন্টিয়ার বাণিজ্যিক মডেলগুলির সাথে প্রতিযোগিতামূলক।

Qwen3.5-27B পরিবারকে একটি ডেন্স মডেল হিসাবে সম্পূর্ণ করে — যার অর্থ হল ইনফারেন্সের সময় সমস্ত 27 বিলিয়ন প্যারামিটার সক্রিয় থাকে — যা সেই ওয়ার্কলোডগুলির জন্য ডিজাইন করা হয়েছে যেখানে কোনও একক মাত্রায় সর্বোচ্চ দক্ষতার চেয়ে বিভিন্ন কাজের মধ্যে সামঞ্জস্যপূর্ণ কর্মক্ষমতা বেশি গুরুত্বপূর্ণ।

ওপেন মডেল কৌশল

Qwen 3.5 কে ওপেন মডেল হিসাবে প্রকাশ করার Alibaba-এর সিদ্ধান্ত একটি কৌশলগত পছন্দ যা এটিকে OpenAI এবং, কিছু পরিমাণে, Anthropic দ্বারা পছন্দের ক্লোজড-সোর্স পদ্ধতিগুলি থেকে আলাদা করে। ওজনগুলি অবাধে উপলব্ধ করে, Alibaba এই বাজি ধরছে যে ইকোসিস্টেম গ্রহণ এবং ডাউনস্ট্রিম উদ্ভাবন মডেলগুলিকে মালিকানাধীন রাখার চেয়ে বেশি মূল্য তৈরি করবে।

এই পদ্ধতিটি ইতিমধ্যে Qwen পরিবারের জন্য সুফল বয়ে এনেছে। Qwen-এর পূর্ববর্তী রিলিজগুলি ওপেন-সোর্স সম্প্রদায়ের মধ্যে ব্যাপকভাবে গৃহীত হয়েছে, বিশেষ অ্যাপ্লিকেশনগুলির জন্য ফাইন-টিউন করা হয়েছে, এবং সেই সংস্থাগুলি দ্বারা বাণিজ্যিক পণ্যগুলিতে একীভূত করা হয়েছে যারা হয় খরচ বহন করতে পারে না বা ক্লোজড API সরবরাহকারীদের উপর নির্ভর না করার সিদ্ধান্ত নিয়েছে। প্রতিটি নতুন রিলিজ ওপেন-ওয়েট ইকোসিস্টেমে Meta-এর Llama পরিবারের জন্য Alibaba-এর অবস্থানকে ডি ফ্যাক্টো বিকল্প হিসাবে শক্তিশালী করে।

রিলিজের সময়টিও তাৎপর্যপূর্ণ। এটি এমন সময়ে এসেছে যখন AI শিল্প এই প্রশ্নগুলির সাথে লড়াই করছে যে ওপেন মডেলগুলি সত্যিই ক্লোজড ফ্রন্টিয়ার সিস্টেমগুলির সাথে তাল মিলিয়ে চলতে পারে কিনা। Qwen 3.5 এর সাথে, Alibaba একটি আক্রমণাত্মক যুক্তি তৈরি করছে যে তারা পারে — এবং নাটকীয়ভাবে কম খরচে।

খরচ সুবিধা এবং বাজার প্রভাব

খরচের যুক্তি Alibaba-এর পিচের কেন্দ্রবিন্দুতে রয়েছে। যখন উদ্যোগগুলি তাদের AI স্থাপনগুলিকে পরীক্ষামূলক প্রোটোটাইপ থেকে উৎপাদন সিস্টেমে স্কেল করে যা প্রতিদিন লক্ষ লক্ষ অনুরোধ প্রক্রিয়া করে, তখন OpenAI এবং Anthropic-এর মতো সরবরাহকারীদের থেকে API খরচ দ্রুত বাড়তে পারে। ওপেন মডেলগুলি যা সেলফ-হোস্ট করা যেতে পারে তা সম্পূর্ণরূপে প্রতি-টোকেন চার্জগুলি দূর করে, সেগুলিকে স্থির পরিকাঠামো খরচ দিয়ে প্রতিস্থাপন করে যা স্কেলে ক্রমবর্ধমানভাবে সাশ্রয়ী হয়ে ওঠে।

মিক্সচার-অফ-এক্সপার্টস আর্কিটেকচার এই সুবিধাটিকে আরও বাড়িয়ে তোলে। প্রতি ইনফারেন্স কলে প্যারামিটারের একটি ভগ্নাংশ সক্রিয় করে, MoE মডেলগুলি সমতুল্য মানের ডেন্স মডেলগুলির চেয়ে ভাল পারফরম্যান্স-প্রতি-ডলার সরবরাহ করে। GPU ক্লাস্টারগুলিতে AI ওয়ার্কলোড চালানো সংস্থাগুলির জন্য, এটি সরাসরি কম হার্ডওয়্যার প্রয়োজনীয়তা বা বিদ্যমান পরিকাঠামোতে উচ্চতর থ্রুপুট-এ অনুবাদ করে।

AI ল্যান্ডস্কেপের জন্য এর অর্থ কী

Qwen 3.5-এর রিলিজ একটি প্রবণতাকে শক্তিশালী করে যা 2025 এবং 2026 জুড়ে ত্বরান্বিত হচ্ছে: ওপেন এবং ক্লোজড মডেলের মধ্যে ব্যবধান অনেকের ভবিষ্যদ্বাণীর চেয়ে দ্রুত সঙ্কুচিত হচ্ছে। যেখানে ফ্রন্টিয়ার ক্লোজড মডেলগুলি একসময় সক্ষমতায় একটি কমান্ডিং লিড রাখত, সেখানে ওপেন বিকল্পগুলি এখন বেশিরভাগ বেঞ্চমার্কে নাগালের মধ্যে রয়েছে, যখন খরচ, কাস্টমাইজযোগ্যতা এবং ডেটা গোপনীয়তার সুবিধাগুলি সরবরাহ করে যা ক্লোজড API গুলি মেলে না।

তাদের AI কৌশলগুলি মূল্যায়নকারী ডেভেলপার এবং উদ্যোগগুলির জন্য, Qwen 3.5 পরিবার একটি আকর্ষণীয় বিকল্প উপস্থাপন করে যা GPT-5 mini, Claude Sonnet 4.5, এবং Meta-এর Llama 4 সিরিজের সাথে গুরুতর বিবেচনার যোগ্য। অত্যাধুনিক AI ক্ষমতার খরচ কমতে থাকায়, ক্লোজড-সোর্স সরবরাহকারীদের উপর তাদের মূল্য প্রিমিয়ামকে ন্যায্যতা দেওয়ার চাপ কেবল বাড়বে।

এই নিবন্ধটি The Decoder-এর রিপোর্টিংয়ের উপর ভিত্তি করে তৈরি। মূল নিবন্ধটি পড়ুন