সুপারইন্টেলিজেন্স টিমের প্রথম পদক্ষেপ

মাইক্রোসফটের সম্প্রতি প্রতিষ্ঠিত সুপারইন্টেলিজেন্স টিম — একটি অভ্যন্তরীণ গ্রুপ যা বর্তমান বড় ভাষা মডেলের পারফরম্যান্সের বাইরে AI ক্ষমতা উন্নয়নের জন্য নিয়োজিত — তার প্রথম পণ্য বিতরণ করেছে: MAI-Image-2, একটি টেক্সট-টু-ইমেজ জেনারেশন মডেল যা মাইক্রোসফট তার পণ্য স্যুট জুড়ে একীভূত করছে এবং তার Azure AI প্ল্যাটফর্মের মাধ্যমে API এর জন্য ডেভেলপারদের কাছে উপলব্ধ করছে।

এই ঘোষণাটি মাইক্রোসফটের মধ্যে একটি কিছুটা রহস্যময় বিভাগ থেকে একটি কংক্রিট আউটপুট চিহ্নিত করে — যা উল্লেখযোগ্য প্রতিভা এবং সংস্থান আকর্ষণ করেছে কারণ কোম্পানি নিজেকে AI উন্নয়নের পরবর্তী পর্যায় হিসাবে বর্ণনা করে যা সে অবস্থান করছে। MAI-Image-2 একটি প্রতিযোগিতামূলক ইমেজ জেনারেশন বাজারে প্রবেश করে যা ইতিমধ্যে DALL-E 3 (যা মাইক্রোসফট OpenAI থেকে লাইসেন্স করে), Midjourney, Stable Diffusion, এবং Google এর Imagen সিরিজ অন্তর্ভুক্ত করে।

MAI-Image-2 কী

MAI-Image-2 একটি টেক্সট-টু-ইমেজ জেনারেটিভ মডেল — ব্যবহারকারীরা একটি টেক্সট বর্ণনা ইনপুট করে এবং মডেল একটি অনুরূপ ইমেজ উৎপাদন করে। এই ধরনের আউটপুটের গুণমান, সামঞ্জস্যতা, এবং শৈল্পিক নমনীয়তা গত তিন বছরে নাটকীয়ভাবে উন্নত হয়েছে, এবং শিল্পের অত্যাধুনিক এখন ফটোবাস্তবিক চিত্র, তেল চিত্র থেকে পিক্সেল আর্ট পর্যন্ত শৈল্পিক শৈলী, এবং জটিল সংমিশ্রণকারী দৃশ্য যা মাত্র কয়েক বছর আগে স্বয়ংক্রিয়ভাবে তৈরি করা অসম্ভব ছিল তা অন্তর্ভুক্ত করে।

মাইক্রোসফট MAI-Image-2 এর জন্য বিস্তৃত প্রযুক্তিগত বিশেষত্ব প্রকাশ করেনি, তবে মডেলটির মাইক্রোসফটের পণ্য জুড়ে রোলআউট এটি মাইক্রোসফট ডিজাইনার, Bing-এ ইমেজ ক্রিয়েটর, এবং সম্ভবত Office অ্যাপ্লিকেশনে এম্বেড করা Copilot সহায়কগুলিতে একীভূত হবে তা নির্দেশ করে। API উপলব্ধতা নির্দেশ করে যে মাইক্রোসফট ডেভেলপার গ্রহণের জন্য প্রতিযোগিতা করার অভিপ্রায় রাখে — তৃতীয় পক্ষের অ্যাপ্লিকেশনগুলির একটি পাইপলাইন তৈরি করে যা তাদের জেনারেশন ব্যাকএন্ড হিসাবে MAI-Image-2 ব্যবহার করে।

মাইক্রোসফটের নিজস্ব মডেলের প্রয়োজন কেন

মাইক্রোসফটের বর্তমান প্রাথমিক ইমেজ জেনারেশন ক্ষমতা OpenAI এর সাথে তার অংশীদারিত্বের মাধ্যমে আসে, DALL-E 3 এর মাধ্যমে। মালিকানাধীন জেনারেশন ক্ষমতা তৈরি করা মাইক্রোসফটকে বেশ কয়েকটি সুবিধা প্রদান করে: একজন অংশীদার থেকে স্বাধীনতা যার অগ্রাধিকারগুলি সর্বদা সারিবদ্ধ নাও হতে পারে, স্কেলে প্রতি-অনুমান খরচ কম, নির্দিষ্ট মাইক্রোসফট ব্যবহারের ক্ষেত্রেগুলির জন্য মডেলগুলি সূক্ষ্ম-সুর করার ক্ষমতা, এবং যে আলোচনার শক্তি আসে তা থেকে কার্যকর বিকল্প থাকার।

সুপারইন্টেলিজেন্স টিমের আদেশ ইমেজ জেনারেশনের চেয়ে বিস্তৃত — এটি ভবিষ্যত AI আর্কিটেকচারে গবেষণা অন্তর্ভুক্ত করে যা অবশেষে বর্তমান ট্রান্সফর্মার-ভিত্তিক মডেলগুলি অতিক্রম করতে পারে। তবে একটি পণ্য পাঠানো নির্দেশ করে যে টিম বিশুদ্ধ গবেষণা দিগন্তের পরিবর্তে ব্যবহারিক পণ্য সময়সীমায় পরিচালনা করছে, যা AI শিল্পের বাকি অংশ মাইক্রোসফটের ইন-হাউস ক্ষমতা সম্পর্কে কীভাবে চিন্তা করা উচিত তা পরিবর্তন করে।

প্রতিযোগিতামূলক ল্যান্ডস্কেপ

মাইক্রোসফটের সুবিধা বিতরণ: Office ইকোসিস্টেম শত শত মিলিয়ন ব্যবহারকারীদের কাছে পৌঁছায়, এবং Word, PowerPoint, এবং Teams-এ সরাসরি ইমেজ জেনারেশন একীভূত করা একটি অ্যাক্সেসযোগ্য এন্ট্রি পয়েন্ট তৈরি করে যার জন্য ব্যবহারকারীদের একটি স্বতন্ত্র ইমেজ জেনারেশন সেবা খোঁজার প্রয়োজন নেই। যদি MAI-Image-2 শিল্পের বর্তমান অবস্থার সাথে প্রতিযোগিতামূলকভাবে সঞ্চালন করে, তাহলে বিতরণ সুবিধা যেকোনো প্রযুক্তিগত পার্থক্যের চেয়ে আরও বেশি গুরুত্বপূর্ণ হতে পারে।

MAI-Image-2 এর ব্যাপক তাৎপর্য নির্দিষ্ট ক্ষমতার চেয়ে কম হতে পারে এবং এটি যা সংকেত দেয় তা বেশি হতে পারে: যে মাইক্রোসফট OpenAI এর মাধ্যমে নির্দেশনা দেয় না এমন AI ক্ষমতা উন্নয়নে বিনিয়োগ করছে, এবং সুপারইন্টেলিজেন্স টিমের কাজ এখন বাহ্যিক বিশ্বের কাছে দৃশ্যমান ডিলিভারেবল তৈরি করছে।

এই নিবন্ধটি The Decoder দ্বারা রিপোর্টিং এর উপর ভিত্তি করে। মূল নিবন্ধটি পড়ুন

Originally published on the-decoder.com