माइक्रोसॉफ्ट सुपरइंटेलिजेंस टीम MAI-Image-2 जेनरेटर शिप करती है

सुपरइंटेलिजेंस टीम की पहली चाल

माइक्रोसॉफ्ट की हाल ही में स्थापित सुपरइंटेलिजेंस टीम — एक आंतरिक समूह जो वर्तमान बड़े भाषा मॉडल के प्रदर्शन से परे AI क्षमताओं को विकसित करने का काम कर रहा है — ने अपना पहला उत्पाद दिया है: MAI-Image-2, एक टेक्स्ट-टू-इमेज जनरेशन मॉडल जो माइक्रोसॉफ्ट अपने उत्पाद सूट में एकीकृत कर रहा है और अपने Azure AI प्लेटफॉर्म के माध्यम से API के लिए डेवलपर्स को उपलब्ध करा रहा है।

यह घोषणा माइक्रोसॉफ्ट के भीतर एक कुछ हद तक रहस्यमय विभाग से ठोस परिणाम चिह्नित करती है — एक ऐसी टीम जो महत्वपूर्ण प्रतिभा और संसाधनों को आकर्षित कर रही है क्योंकि कंपनी खुद को AI विकास के अगले चरण के लिए तैयार कर रही है। MAI-Image-2 एक प्रतिस्पर्धी इमेज जनरेशन बाजार में प्रवेश करता है जिसमें पहले से DALL-E 3 (जिसे माइक्रोसॉफ्ट OpenAI से लाइसेंस करता है), Midjourney, Stable Diffusion, और Google की Imagen सीरीज शामिल हैं।

MAI-Image-2 क्या है

MAI-Image-2 एक टेक्स्ट-टू-इमेज जेनरेटिव मॉडल है — उपयोगकर्ता टेक्स्ट विवरण इनपुट करते हैं और मॉडल एक संबंधित छवि बनाता है। ऐसे आउटपुट की गुणवत्ता, सामंजस्य और शैलीगत लचीलापन पिछले तीन वर्षों में नाटकीय रूप से सुधार हुई है, और अब तकनीकी स्तर पर फोटो-रियलिस्टिक इमेजरी, तेल पेंटिंग से लेकर पिक्सल आर्ट तक की कलात्मक शैलियां, और जटिल संरचनात्मक दृश्य शामिल हैं जो मुश्किल से कुछ साल पहले स्वचालित रूप से जेनरेट करना संभव नहीं था।

माइक्रोसॉफ्ट ने MAI-Image-2 के लिए विस्तृत तकनीकी विशिष्टताएं जारी नहीं की हैं, लेकिन माइक्रोसॉफ्ट के उत्पादों में मॉडल का रोलआउट सुझाता है कि इसे माइक्रोसॉफ्ट डिजाइनर, Bing में इमेज क्रिएटर, और संभवतः Office एप्लिकेशन में एम्बेड किए गए Copilot सहायकों में एकीकृत किया जाएगा। API उपलब्धता इंगित करती है कि माइक्रोसॉफ्ट डेवलपर अपनाने के लिए भी प्रतिस्पर्धा करना चाहता है — तीसरे पक्ष के एप्लिकेशन की एक पाइपलाइन बनाना जो अपने जनरेशन बैकएंड के रूप में MAI-Image-2 का उपयोग करते हैं।

Create, edit and star in videos with two Google Vids updates

Google Vids में Gemini Omni और व्यक्तिगत अवतार जोड़े गए

Google Workspace में AI वीडियो निर्माण का विस्तार कर रहा है, जिसमें प्रॉम्प्ट-आधारित क्लिप जनरेशन और एडिटिंग के साथ-साथ सेल्फी और आवाज़ रिकॉर्डिंग से बने कस्टम अवतार शामिल हैं।

Read article

माइक्रोसॉफ्ट को अपने स्वयं के मॉडल की आवश्यकता क्यों है

माइक्रोसॉफ्ट की वर्तमान प्राथमिक इमेज जनरेशन क्षमता OpenAI के साथ अपनी साझेदारी के माध्यम से आती है, DALL-E 3 के माध्यम से। मालिकाना जनरेशन क्षमताएं बनाना माइक्रोसॉफ्ट को कई लाभ प्रदान करता है: एक साथी से आजादी जिसकी प्राथमिकताएं हमेशा संरेखित नहीं हो सकती हैं, बड़े पैमाने पर प्रति-अनुमान लागत में कमी, विशिष्ट माइक्रोसॉफ्ट उपयोग के मामलों के लिए मॉडल को सूक्ष्म-ट्यून करने की क्षमता, और व्यवहार्य विकल्प रखने से आने वाली बातचीत शक्ति।

सुपरइंटेलिजेंस टीम का आदेश इमेज जनरेशन से परे है — इसमें भविष्य के AI आर्किटेक्चर में अनुसंधान शामिल है जो अंततः वर्तमान ट्रांसफॉर्मर-आधारित मॉडल को पार कर सकता है। लेकिन एक उत्पाद भेजना यह दर्शाता है कि टीम विशुद्ध रूप से अनुसंधान क्षितिज के बजाय व्यावहारिक उत्पाद समय सीमा पर संचालित हो रही है, जो AI उद्योग के बाकी हिस्सों को माइक्रोसॉफ्ट की इन-हाउस क्षमताओं के बारे में सोचना चाहिए इसे बदल देता है।

प्रतिस्पर्धी परिदृश्य

माइक्रोसॉफ्ट का लाभ वितरण है: Office इकोसिस्टेम सैकड़ों मिलियन उपयोगकर्ताओं तक पहुंचता है, और Word, PowerPoint और Teams में सीधे इमेज जनरेशन को एकीकृत करना एक सुलभ प्रवेश बिंदु बनाता है जिसके लिए उपयोगकर्ताओं को एक अलग इमेज जनरेशन सेवा की तलाश करने की आवश्यकता नहीं है। यदि MAI-Image-2 कला की वर्तमान स्थिति के साथ प्रतिस्पर्धी रूप से कार्य करता है, तो वितरण लाभ किसी भी तकनीकी विभेद से अधिक महत्वपूर्ण हो सकता है।

MAI-Image-2 का व्यापक महत्व विशिष्ट क्षमता के बारे में कम और इसके संकेत के बारे में अधिक हो सकता है: माइक्रोसॉफ्ट OpenAI के माध्यम से नहीं जाने वाली AI क्षमता विकास में निवेश कर रहा है, और सुपरइंटेलिजेंस टीम का काम अब बाहरी दुनिया के लिए दृश्यमान डिलीवरेबल पैदा कर रहा है।

यह लेख The Decoder द्वारा रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें।

Originally published on the-decoder.com

माइक्रोसॉफ्ट की सुपरइंटेलिजेंस टीम अपना पहला उत्पाद लॉन्च करती है: MAI-Image-2

सुपरइंटेलिजेंस टीम की पहली चाल

MAI-Image-2 क्या है

Google Vids में Gemini Omni और व्यक्तिगत अवतार जोड़े गए

माइक्रोसॉफ्ट को अपने स्वयं के मॉडल की आवश्यकता क्यों है

प्रतिस्पर्धी परिदृश्य

Comments (0)

Keep Reading