सुपरइंटेलिजेंस टीम की पहली चाल
माइक्रोसॉफ्ट की हाल ही में स्थापित सुपरइंटेलिजेंस टीम — एक आंतरिक समूह जो वर्तमान बड़े भाषा मॉडल के प्रदर्शन से परे AI क्षमताओं को विकसित करने का काम कर रहा है — ने अपना पहला उत्पाद दिया है: MAI-Image-2, एक टेक्स्ट-टू-इमेज जनरेशन मॉडल जो माइक्रोसॉफ्ट अपने उत्पाद सूट में एकीकृत कर रहा है और अपने Azure AI प्लेटफॉर्म के माध्यम से API के लिए डेवलपर्स को उपलब्ध करा रहा है।
यह घोषणा माइक्रोसॉफ्ट के भीतर एक कुछ हद तक रहस्यमय विभाग से ठोस परिणाम चिह्नित करती है — एक ऐसी टीम जो महत्वपूर्ण प्रतिभा और संसाधनों को आकर्षित कर रही है क्योंकि कंपनी खुद को AI विकास के अगले चरण के लिए तैयार कर रही है। MAI-Image-2 एक प्रतिस्पर्धी इमेज जनरेशन बाजार में प्रवेश करता है जिसमें पहले से DALL-E 3 (जिसे माइक्रोसॉफ्ट OpenAI से लाइसेंस करता है), Midjourney, Stable Diffusion, और Google की Imagen सीरीज शामिल हैं।
MAI-Image-2 क्या है
MAI-Image-2 एक टेक्स्ट-टू-इमेज जेनरेटिव मॉडल है — उपयोगकर्ता टेक्स्ट विवरण इनपुट करते हैं और मॉडल एक संबंधित छवि बनाता है। ऐसे आउटपुट की गुणवत्ता, सामंजस्य और शैलीगत लचीलापन पिछले तीन वर्षों में नाटकीय रूप से सुधार हुई है, और अब तकनीकी स्तर पर फोटो-रियलिस्टिक इमेजरी, तेल पेंटिंग से लेकर पिक्सल आर्ट तक की कलात्मक शैलियां, और जटिल संरचनात्मक दृश्य शामिल हैं जो मुश्किल से कुछ साल पहले स्वचालित रूप से जेनरेट करना संभव नहीं था।
माइक्रोसॉफ्ट ने MAI-Image-2 के लिए विस्तृत तकनीकी विशिष्टताएं जारी नहीं की हैं, लेकिन माइक्रोसॉफ्ट के उत्पादों में मॉडल का रोलआउट सुझाता है कि इसे माइक्रोसॉफ्ट डिजाइनर, Bing में इमेज क्रिएटर, और संभवतः Office एप्लिकेशन में एम्बेड किए गए Copilot सहायकों में एकीकृत किया जाएगा। API उपलब्धता इंगित करती है कि माइक्रोसॉफ्ट डेवलपर अपनाने के लिए भी प्रतिस्पर्धा करना चाहता है — तीसरे पक्ष के एप्लिकेशन की एक पाइपलाइन बनाना जो अपने जनरेशन बैकएंड के रूप में MAI-Image-2 का उपयोग करते हैं।
माइक्रोसॉफ्ट को अपने स्वयं के मॉडल की आवश्यकता क्यों है
माइक्रोसॉफ्ट की वर्तमान प्राथमिक इमेज जनरेशन क्षमता OpenAI के साथ अपनी साझेदारी के माध्यम से आती है, DALL-E 3 के माध्यम से। मालिकाना जनरेशन क्षमताएं बनाना माइक्रोसॉफ्ट को कई लाभ प्रदान करता है: एक साथी से आजादी जिसकी प्राथमिकताएं हमेशा संरेखित नहीं हो सकती हैं, बड़े पैमाने पर प्रति-अनुमान लागत में कमी, विशिष्ट माइक्रोसॉफ्ट उपयोग के मामलों के लिए मॉडल को सूक्ष्म-ट्यून करने की क्षमता, और व्यवहार्य विकल्प रखने से आने वाली बातचीत शक्ति।
सुपरइंटेलिजेंस टीम का आदेश इमेज जनरेशन से परे है — इसमें भविष्य के AI आर्किटेक्चर में अनुसंधान शामिल है जो अंततः वर्तमान ट्रांसफॉर्मर-आधारित मॉडल को पार कर सकता है। लेकिन एक उत्पाद भेजना यह दर्शाता है कि टीम विशुद्ध रूप से अनुसंधान क्षितिज के बजाय व्यावहारिक उत्पाद समय सीमा पर संचालित हो रही है, जो AI उद्योग के बाकी हिस्सों को माइक्रोसॉफ्ट की इन-हाउस क्षमताओं के बारे में सोचना चाहिए इसे बदल देता है।
प्रतिस्पर्धी परिदृश्य
माइक्रोसॉफ्ट का लाभ वितरण है: Office इकोसिस्टेम सैकड़ों मिलियन उपयोगकर्ताओं तक पहुंचता है, और Word, PowerPoint और Teams में सीधे इमेज जनरेशन को एकीकृत करना एक सुलभ प्रवेश बिंदु बनाता है जिसके लिए उपयोगकर्ताओं को एक अलग इमेज जनरेशन सेवा की तलाश करने की आवश्यकता नहीं है। यदि MAI-Image-2 कला की वर्तमान स्थिति के साथ प्रतिस्पर्धी रूप से कार्य करता है, तो वितरण लाभ किसी भी तकनीकी विभेद से अधिक महत्वपूर्ण हो सकता है।
MAI-Image-2 का व्यापक महत्व विशिष्ट क्षमता के बारे में कम और इसके संकेत के बारे में अधिक हो सकता है: माइक्रोसॉफ्ट OpenAI के माध्यम से नहीं जाने वाली AI क्षमता विकास में निवेश कर रहा है, और सुपरइंटेलिजेंस टीम का काम अब बाहरी दुनिया के लिए दृश्यमान डिलीवरेबल पैदा कर रहा है।
यह लेख The Decoder द्वारा रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें।
Originally published on the-decoder.com





