Superintelligence টीม এর প্রথম পদক্ষেप
Microsoft এর সম్ప్రતి स्थাপित superintelligence टीम — एक आंतরिक समूह जो वर्तमান বड़े भाषा मॉडेल के प्रदर्शन से परे AI क्षमताओं को विकसित करने के लिए नियोजित है — इसका पहला उत्पाद दिया है: MAI-Image-2, एक टेक्स्ट-टू-इमेज जनरेशन मॉडल जो Microsoft इसके उत्पाद सूट में एकीकृत कर रहा है और इसके Azure AI प्लेटफॉर्म के माध्यम से API के लिए डेवलपर्स को उपलब्ध करा रहा है।
घोषणा Microsoft के भीतर एक कुछ रहस्यमय বিভাग से एक ठोस उत्पादन चिह्नित करती है — एक टीम जो महत्वपूर्ण प्रतिभा और संसाधन आकर्षित कर रही है क्योंकि कंपनी स्वयं को AI विकास के अगले चरण के लिए स्थिति दे रही है। MAI-Image-2 एक प्रतिस्पर्धी इमेज जनरेशन बाजार में प्रवेश करता है जिसमें पहले से DALL-E 3 (जो Microsoft OpenAI से लाइसेंस करता है), Midjourney, Stable Diffusion, और Google की Imagen सीरीज शामिल है।
MAI-Image-2 क्या है
MAI-Image-2 एक टेक्स्ट-टू-इमेज जनरेटिव मॉडल है — उपयोगकर्ता टेक्स्ट विवरण इनपुट करते हैं और मॉडल एक संबंधित छवि उत्पन्न करता है। ऐसे आउटपुट की गुणवत्ता, सामंजस्य और शैलीगत लचीलापन पिछले तीन वर्षों में नाटकीय रूप से सुधार हुई है, और अब कला की स्थिति फोटो-यथार्थवादी इमेजरी, तेल चित्रकला से लेकर पिक्सेल आर्ट तक की कलात्मक शैलियां, और जटिल compositional दृश्य शामिल हैं जो मुश्किल से कुछ साल पहले स्वचालित रूप से उत्पन्न करने के लिए असंभव थे।
Microsoft ने MAI-Image-2 के लिए विस्तृत तकनीकी विनिर्देश जारी नहीं किए हैं, लेकिन Microsoft के उत्पादों में मॉडल का रोलआउट सुझाता है कि इसे Microsoft डिजाइनर, Bing में इमेज क्रिएटर, और संभवतः Office अनुप्रयोगों में एम्बेड Copilot सहायकों में एकीकृत किया जाएगा। API उपलब्धता इंगित करती है कि Microsoft डेवलपर अपनाने के लिए भी प्रतिस्पर्धा करना चाहता है — तीसरे पक्ष के अनुप्रयोगों की एक पाइपलाइन बनाना जो अपने जनरेशन बैकएंड के रूप में MAI-Image-2 का उपयोग करते हैं।
Microsoft को अपने स्वयं के मॉडल की आवश्यकता क्यों है
Microsoft की वर्तमान प्राथमिक इमेज जनरेशन क्षमता OpenAI के साथ इसकी साझेदारी के माध्यम से आती है, DALL-E 3 के माध्यम से। मालिकाना जनरेशन क्षमताएं बनाना Microsoft को कई लाभ प्रदान करता है: एक साथी से स्वतंत्रता जिसकी प्राथमिकताएं हमेशा संरेखित नहीं हो सकती हैं, बड़े पैमाने पर प्रति-अनुमान लागत में कमी, विशिष्ट Microsoft उपयोग के मामलों के लिए मॉडेल को सूक्ष्म-ट्यून करने की क्षमता, और व्यवहार्य विकल्प रखने से आने वाली बातचीत शक्ति।
Superintelligence टीम का जनादेश इमेज जनरेशन से परे है — यह भविष्य के AI आर्किटेक्चर में अनुसंधान शामिल करता है जो अंततः वर्तमान ट्रांसफॉर्मर-आधारित मॉडेल को पार कर सकता है। लेकिन एक उत्पाद भेज रहा है यह दर्शाता है कि टीम विशुद्ध रूप से अनुसंधान क्षितिज के बजाय ব্যবহारिক उत्पाद समय सीमा पर संचालित हो रही है, जो AI उद्योग के बाकी हिस्सों को Microsoft की इन-हाउस क्षमताओं के बारे में सोचना चाहिए इसे बदल देता है।
प्रतिस्पर्धी परिदृश्य
Microsoft का लाभ배포 है: Office ইকोसিস্टেম सैकड़ों मिलियन उपयोगकर्ताओं तक पहुंचता है, और Word, PowerPoint और Teams में सीधे इमेज जनरेशन एकीकृत करना एक सुलभ प्रवेश बिंदु बनाता है जिसके लिए उपयोगकर्ताओं को एक अलग इमेज जनरेशन सेवा की तलाश करने की आवश्यकता नहीं है। यदि MAI-Image-2 कला की वर्तमान स्थिति के साथ प्रतिस्पर्धी रूप से कार्य करता है, तो वितरण लाभ किसी भी तकनीकी भेद से अधिक महत्वपूर्ण हो सकता है।
MAI-Image-2 का व्यापक महत्व विशिष्ट क्षमता के बारे में कम और इसके संकेत के बारे में अधिक हो सकता है: Microsoft OpenAI के माध्यम से नहीं जाने वाली AI क्षमता विकास में निवेश कर रहा है, और superintelligence टीम का काम अब बाहरी दुनिया के लिए दृश्यमान डिलीवरेबल पैदा कर रहा है।
यह लेख The Decoder द्वारा रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें।
Originally published on the-decoder.com


