सुपरइंटेलिजेंस टीमची पहिली चाल
मायक्रोसॉफ्टची हाल ही स्थापन केलेली सुपरइंटेलिजेंस टीम — एक आंतरिक गट जो सद्य मोठ्या भाषा मॉडेलच्या कार्यक्षमतेच्या पलीकडे AI क्षमता विकसित करण्यासाठी नियुक्त आहे — आपले पहिले उत्पाद दिले आहे: MAI-Image-2, एक टेक्स्ट-टू-इमेज जनरेशन मॉडल जी मायक्रोसॉफ्ट आपल्या उत्पाद सूटामध्ये एकीकृत करत आहे आणि तिच्या Azure AI प्लॅटफॉर्मद्वारे API साठी डेव्हलपर्सना उपलब्ध करत आहे।
हा घोषणा मायक्रोसॉफ्टच्या अंतर्गत काहीसे रहस्यमय विभागातून ठोस परिणाम सूचित करते — अशी टीम जी महत्त्वपूर्ण प्रतिभा आणि संसाधन आकर्षित करत आहे कारण कंपनी खुद्दास AI विकासचे पुढील टप्पा तयार करत आहे. MAI-Image-2 प्रतिस्पर्धी इमेज जनरेशन बाजारामध्ये प्रवेश करते जिथे DALL-E 3 (जी मायक्रोसॉफ्ट OpenAI कडून लायसन्स करते), Midjourney, Stable Diffusion, आणि Google ची Imagen मालिका आधीच आहेत।
MAI-Image-2 काय आहे
MAI-Image-2 एक टेक्स्ट-टू-इमेज जनरेटिव मॉडल आहे — वापरकर्ते पाठ वर्णन इनपुट करतात आणि मॉडल संबंधित इमेज तयार करते. अशा आउटपुटची गुणवत्ता, सुसंगतता आणि शैलीसंबंधी लचकपणा गेल्या तीन वर्षांमध्ये नाटकीयरित्या सुधारला गेला आहे, आणि अधुनिक आता फोटो-वास्तविक इमेजरी, तेल चित्रापासून पिक्सेल आर्ट पर्यंतच्या कलात्मक शैली आणि जटिल संरचनात्मक दृश्य समाविष्ट करते जे केवळ काही वर्षांपूर्वी स्वयंचलितपणे तयार करणे अशक्य होते।
मायक्रोसॉफ्टने MAI-Image-2 साठी तपशीलवार तांत्रिक विनिर्देश प्रकाशित केले नाहीत, परंतु मायक्रोसॉफ्टच्या उत्पादांमध्ये मॉडेलच्या रोलआउटसूचित करते की ते मायक्रोसॉफ्ट डिজाइनर, Bing मधील इमेज क्रिएटर, आणि संभवत: Office ॲप्लिकेशनमध्ये एम्बेड केलेल्या Copilot सहाय्यकांमध्ये एकीकृत केले जाईल। API उपलब्धता सूचित करते की मायक्रोसॉफ्ट डेव्हलपर स्वीकरणासाठीही प्रतिस्पर्धा करू इच्छितो — तृतीय पक्ष ॲप्लिकेशनची पाइपलाइन तयार करणे जी त्यांच्या जनरेशन बॅकएंड म्हणून MAI-Image-2 वापरतात।
मायक्रोसॉफ्टला आपले स्वतःचे मॉडेल का हवे आहे
मायक्रोसॉफ्टची सद्य प्राथमिक इमेज जनरेशन क्षमता OpenAI सह त्याच्या भागीदारीमधून आली, DALL-E 3 द्वारे। मालकीय जनरेशन क्षमता तयार करणे मायक्रोसॉफ्टला अनेक फायदे देते: अशा भागीदारापासून स्वातंत्र्य ज्यांची प्राधान्ये सर्वदा संरेखित असू शकत नाहीत, मोठ्या प्रमाणावर प्रति-निष्कर्ष खर्च कमी करणे, विशिष्ट मायक्रोसॉफ्ट वापर केसेससाठी मॉडेल सूक्ष्म-ट्यून करण्याची क्षमता, आणि व्यवहार्य पर्याय असण्यातून येणारी वाटाघाटीची शक्ती।
सुपरइंटेलिजेंस टीमचे आदेश इमेज जनरेशनच्या पलीकडे आहे — यामध्ये भविष्यातील AI आर्किटेक्चरमधील संशोधन समाविष्ट आहे जे अंतिमत: सद्य ट्रान्सफॉर्मर-आधारित मॉडेल अतिक्रम करू शकते। परंतु उत्पाद शिपिंग हे सूचित करते की टीम विशुद्धपणे संशोधन क्षितिजांऐवजी व्यावहारिक उत्पाद वेळेवरून कार्य करत आहे, जे बाकी AI उद्योगाने मायक्रोसॉफ्टच्या इन-हाउस क्षमतेविषयी विचार कसा करावा हे बदलते।
प्रतिस्पर्धी परिस्थिती
मायक्रोसॉफ्टचा फायदा वितरण आहे: Office इकोसिस्टेम शत शत दशलक्ष वापरकर्त्यांपर्यंत पोहोचते, आणि Word, PowerPoint, आणि Teams मध्ये थेट इमेज जनरेशन एकीकृत करणे एक सुलभ प्रवेश बिंदू तयार करते जिसासाठी वापरकर्त्यांना वेगळ्या इमेज जनरेशन सेवेची शोध घेण्याची गरज नाही। जर MAI-Image-2 कला च्या सद्य स्थितीसह प्रतिस्पर्धीरित्या कार्य करते, तर वितरण फायदा कोणत्याही तांत्रिक भेदापेक्षा अधिक महत्त्वपूर्ण असू शकतो।
MAI-Image-2 चे व्यापक महत्त्व विशिष्ट क्षमतेपेक्षा कमी आणि ते जे संकेत देते त्यापेक्षा अधिक असू शकते: की मायक्रोसॉफ्ट OpenAI मार्गे न जाणारी AI क्षमता विकास करत आहे, आणि सुपरइंटेलिजेंस टीमचे कार्य आता बाहेरील जगासाठी दृश्यमान वितरण उत्पादन करत आहे।
हा लेख The Decoder द्वारे रिपोर्टिंगवर आधारित आहे। मूळ लेख वाचा।
Originally published on the-decoder.com


