OpenAI का नवीनतम इमेज मॉडल एक बड़ा अंतर कम करता दिख रहा है
ZDNET द्वारा किए गए इमेज-जनरेशन परीक्षणों के नए दौर से संकेत मिलता है कि OpenAI ने इमेज गुणवत्ता और प्रॉम्प्ट हैंडलिंग में बड़ा सुधार किया है। 27 अप्रैल को प्रकाशित नौ-परीक्षण तुलनात्मक अध्ययन में ChatGPT Images 2.0 को 97% अंक मिले, जबकि Google Gemini के Nano Banana को 85% अंक मिले। यह परिणाम इसलिए महत्वपूर्ण है क्योंकि पहले हुए एक तुलनात्मक परीक्षण में ChatGPT, Google की इमेज प्रणाली से काफी पीछे था। इस बार रैंकिंग उलट गई।
स्रोत लेख इस परिणाम को केवल मॉडल बनाम मॉडल मुकाबले से अधिक के रूप में प्रस्तुत करता है। उसका कहना है कि OpenAI का अपडेट केवल क्रमिक सुधार नहीं है, बल्कि रोजमर्रा के उपयोग के लिए महत्वपूर्ण क्षेत्रों में काफी बेहतर है: निर्देशों का पालन, इमेज के भीतर टेक्स्ट को संभालना, और आउटपुट को मूल प्रॉम्प्ट के अनुरूप रखना। यही वे काम हैं जो अक्सर एक चमकदार डेमो और वास्तविक काम के लिए भरोसेमंद टूल के बीच अंतर बनाते हैं।
यह परिणाम अलग क्यों दिखता है
इमेज जनरेशन AI के सबसे तेज़ी से बदलते मोर्चों में से एक बन गई है। कई सिस्टम अब आकर्षक चित्र बना सकते हैं, लेकिन सुसंगतता अब भी कठिन समस्या बनी हुई है। उपयोगकर्ता केवल देखने में अच्छा कुछ नहीं चाहते। वे ऐसा सिस्टम चाहते हैं जो संदर्भ समझे, सीमाओं का पालन करे, और अनुरोध से भटके नहीं।
दिए गए स्रोत पाठ के अनुसार, ChatGPT Images 2.0 ने अपनी सबसे मजबूत प्रगति यहीं दिखाई। ZDNET ने कहा कि मॉडल “dramatically” बेहतर हुआ है और खास तौर पर बेहतर context awareness का उल्लेख किया। लेख में text rendering पर भी जोर दिया गया, जो इमेज मॉडलों के लिए ऐतिहासिक रूप से चुनौतीपूर्ण क्षेत्र रहा है। अगर कोई मॉडल प्रॉम्प्ट के प्रति ईमानदार रहते हुए इमेज में पढ़ने योग्य, उपयुक्त टेक्स्ट डाल सकता है, तो वह प्रस्तुतियों, mockups, diagrams, शैक्षिक visuals, और हल्के design tasks के लिए कहीं अधिक उपयोगी हो जाता है।
Google का Nano Banana इस तुलना में ढह नहीं गया। 85% स्कोर अभी भी एक सक्षम सिस्टम का संकेत देता है। लेकिन रिपोर्ट कहती है कि वह प्रॉम्प्ट अनुशासन और टेक्स्ट हैंडलिंग में चूका, जो कमियाँ आम प्रयोग के बाहर जल्दी ही निर्णायक बन सकती हैं। व्यावहारिक रूप से इसका मतलब है कि किसी उपयोगकर्ता को Google के मॉडल से एक प्रभावशाली इमेज तो मिल सकती है, लेकिन उसे सुधारने या फिर से चलाने में अधिक समय लग सकता है।




