एन्कोडर्सची उत्क्रांती बहुमाध्यम AI घडवत आहे

AI पाइपलाइनचा दुर्लक्षित भाग

कृत्रिम बुद्धिमत्तेबाबतची सार्वजनिक चर्चा अजूनही मुख्यतः प्रणाली काय निर्माण करतात याभोवती फिरते. लोक प्रवाही मजकूर, वास्तवदर्शी प्रतिमा, शिफारसी, आणि सिंथेटिक मीडिया याबद्दल बोलतात. पण AI News च्या एका स्पष्टीकरणानुसार, अधिक शांत प्रश्न असा आहे की या प्रणाली सुरुवातीला त्यांना मिळणारी माहिती समजून कशी घेतात.

तो दृष्टिकोन उपयुक्त आहे, कारण तो लक्ष आकर्षणातून रचनेकडे वळवतो. आउटपुट हे वापरकर्त्यांना दिसते, पण आउटपुट शक्य करणारी गोष्ट म्हणजे समज. हा लेख एन्कोडर्सच्या उत्क्रांतीवर लक्ष केंद्रित करतो, आणि साध्या मॉडेल्सपासून आज multimodal AI ला आधार देणाऱ्या प्रणालींपर्यंतचा मार्ग वर्णन करतो.

वरच्या पातळीवरही, ही उत्क्रांती AI कसे तयार केले जाते आणि त्यावर कशी चर्चा होते, यामध्ये एक महत्त्वाचा बदल दाखवते. प्रणाली जेव्हा अधिक प्रकारची माहिती स्वीकारतात, तेव्हा आव्हान केवळ विश्वासार्ह प्रतिसाद निर्माण करणे इतकेच राहत नाही. वेगवेगळ्या प्रकारच्या इनपुटचे प्रतिनिधित्व आणि अर्थ लावणेही आवश्यक ठरते, जेणेकरून ते एकत्रितपणे एका काम करणाऱ्या मॉडेल वर्तनात रूपांतरित होऊ शकतील. तिथेच एन्कोडर्स दुय्यम न राहता केंद्रस्थानी येतात.

ही पायरी अनेकदा दुर्लक्षित होते, हे समजण्यासारखे आहे. तयार झालेले content दाखवणे अंतर्गत प्रतिनिधित्वापेक्षा सोपे असते. चॅटबॉटचे उत्तर किंवा प्रतिमेचा परिणाम लगेच दिसतो. भाषा, प्रतिमा, किंवा इतर संकेत समजून घेण्यासाठी मदत करणारी यंत्रणा गैर-तज्ज्ञांना कमी वाचनीय वाटते. पण बहुमाध्यम AI अधिक महत्त्वाचे होत असताना, तो लपलेला थर कार्यक्षमता, विश्वासार्हता, आणि उत्पादन रचनेसाठी अधिक महत्त्वाचा ठरतो.

लेखाचा व्यापक मुद्दा असा आहे की AI प्रगतीकडे केवळ जनरेशनच्या दृष्टीने पाहू नये. प्रणाली प्रतिसाद देण्यापूर्वी माहिती कशी प्रक्रिया करतात, याबद्दल एक समांतर कथा आहे. ती कथा तांत्रिक आहे, पण धोरणात्मकही आहे. बहुमाध्यम उत्पादने बनवणाऱ्या कंपन्या फक्त अधिक प्रभावी आउटपुट तयार करण्याच्या शर्यतीत नाहीत. त्या विविध इनपुट सुसंगतपणे समजून घेऊ देणाऱ्या यंत्रणाही सुधारण्याच्या शर्यतीत आहेत.

त्या दृष्टीने पाहिले तर बहुमाध्यम AIचा उदय हा केवळ मॉडेलमध्ये अधिक मीडिया प्रकार जोडण्याबद्दल नाही. तो त्या मीडिया प्रकारांचे मॉडेलच्या अंतर्गत हाताळणीचे सुधारणा करण्याबद्दल आहे, जेणेकरून समज निर्माणाशी पाऊल मिळवून चालू शकेल. AI शोध, सहाय्यक, उत्पादकता साधने, आणि सर्जनशील सॉफ्टवेअरमध्ये अधिक पसरत असताना, तो फरक दुर्लक्षित करणे कठीण होत चालले आहे.

ग्राहक AI कव्हरेजमध्ये एन्कोडर्स क्वचितच मुख्य बातमी बनतात. त्यांना आज मिळतो त्यापेक्षा अधिक महत्त्व असायला हवे. जर AI चा पुढचा टप्पा फॉरमॅट आणि संदर्भांमध्ये काम करू शकणाऱ्या प्रणालींनी परिभाषित होणार असेल, तर खऱ्या प्रगतीचे मोजमाप केवळ मॉडेल काय म्हणू किंवा तयार करू शकते यावर नसेल, तर आधी दिलेली माहिती ते किती चांगल्या प्रकारे समजून घेते यावरही असेल.

हा लेख AI News च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.

Originally published on artificialintelligence-news.com

AI बहुमाध्यम होत असताना एन्कोडर्स अधिक महत्त्वाचे का ठरतात

AI पाइपलाइनचा दुर्लक्षित भाग

Comments (0)

Keep Reading