ChatGPT Images 2.0 ने नए परीक्षण में Gemini Nano Banana को हराया

OpenAI का नवीनतम इमेज मॉडल एक बड़ा अंतर कम करता दिख रहा है

ZDNET द्वारा किए गए इमेज-जनरेशन परीक्षणों के नए दौर से संकेत मिलता है कि OpenAI ने इमेज गुणवत्ता और प्रॉम्प्ट हैंडलिंग में बड़ा सुधार किया है। 27 अप्रैल को प्रकाशित नौ-परीक्षण तुलनात्मक अध्ययन में ChatGPT Images 2.0 को 97% अंक मिले, जबकि Google Gemini के Nano Banana को 85% अंक मिले। यह परिणाम इसलिए महत्वपूर्ण है क्योंकि पहले हुए एक तुलनात्मक परीक्षण में ChatGPT, Google की इमेज प्रणाली से काफी पीछे था। इस बार रैंकिंग उलट गई।

स्रोत लेख इस परिणाम को केवल मॉडल बनाम मॉडल मुकाबले से अधिक के रूप में प्रस्तुत करता है। उसका कहना है कि OpenAI का अपडेट केवल क्रमिक सुधार नहीं है, बल्कि रोजमर्रा के उपयोग के लिए महत्वपूर्ण क्षेत्रों में काफी बेहतर है: निर्देशों का पालन, इमेज के भीतर टेक्स्ट को संभालना, और आउटपुट को मूल प्रॉम्प्ट के अनुरूप रखना। यही वे काम हैं जो अक्सर एक चमकदार डेमो और वास्तविक काम के लिए भरोसेमंद टूल के बीच अंतर बनाते हैं।

यह परिणाम अलग क्यों दिखता है

इमेज जनरेशन AI के सबसे तेज़ी से बदलते मोर्चों में से एक बन गई है। कई सिस्टम अब आकर्षक चित्र बना सकते हैं, लेकिन सुसंगतता अब भी कठिन समस्या बनी हुई है। उपयोगकर्ता केवल देखने में अच्छा कुछ नहीं चाहते। वे ऐसा सिस्टम चाहते हैं जो संदर्भ समझे, सीमाओं का पालन करे, और अनुरोध से भटके नहीं।

दिए गए स्रोत पाठ के अनुसार, ChatGPT Images 2.0 ने अपनी सबसे मजबूत प्रगति यहीं दिखाई। ZDNET ने कहा कि मॉडल “dramatically” बेहतर हुआ है और खास तौर पर बेहतर context awareness का उल्लेख किया। लेख में text rendering पर भी जोर दिया गया, जो इमेज मॉडलों के लिए ऐतिहासिक रूप से चुनौतीपूर्ण क्षेत्र रहा है। अगर कोई मॉडल प्रॉम्प्ट के प्रति ईमानदार रहते हुए इमेज में पढ़ने योग्य, उपयुक्त टेक्स्ट डाल सकता है, तो वह प्रस्तुतियों, mockups, diagrams, शैक्षिक visuals, और हल्के design tasks के लिए कहीं अधिक उपयोगी हो जाता है।

Google का Nano Banana इस तुलना में ढह नहीं गया। 85% स्कोर अभी भी एक सक्षम सिस्टम का संकेत देता है। लेकिन रिपोर्ट कहती है कि वह प्रॉम्प्ट अनुशासन और टेक्स्ट हैंडलिंग में चूका, जो कमियाँ आम प्रयोग के बाहर जल्दी ही निर्णायक बन सकती हैं। व्यावहारिक रूप से इसका मतलब है कि किसी उपयोगकर्ता को Google के मॉडल से एक प्रभावशाली इमेज तो मिल सकती है, लेकिन उसे सुधारने या फिर से चलाने में अधिक समय लग सकता है।

Visa is handling AI-prompted transactions for OpenAI - but can you trust it?

Visa और OpenAI ने agentic payments को आगे बढ़ाया

Visa और OpenAI AI-चालित लेनदेन को guardrails के साथ समर्थन देने की दिशा में बढ़ रहे हैं, जो संकेत देता है कि agentic commerce एक गंभीर payments battleground बन रहा है.

Read article

पिछले दौर के बाद क्या बदला

लेख का सबसे उल्लेखनीय पहलू केवल यह नहीं है कि ChatGPT जीता, बल्कि यह है कि पिछले benchmark की तुलना में उसने कितनी निर्णायक बढ़त ली। ZDNET ने कहा कि जब उसने दिसंबर 2025 में समान परीक्षण किए थे, तो Nano Banana को 93% मिले थे, जबकि ChatGPT को 74% ही मिले थे, आंशिक रूप से इसलिए कि उसने कुछ pop-culture prompts को अस्वीकार कर दिया था। नवीनतम तुलना में OpenAI का मॉडल 97% तक पहुँच गया, जबकि Gemini का स्कोर 85% रहा।

यह बदलाव संकेत देता है कि एक साथ दो प्रकार के परिवर्तन हो रहे हैं। पहला, OpenAI ने core generation quality और instruction-following में सुधार किया है। दूसरा, इस श्रेणी के benchmark परिणाम नाज़ुक होते हैं क्योंकि वे prompt policy, refusal behavior, और model tuning पर बहुत निर्भर करते हैं। एक कंपनी अपने उत्पाद व्यवहार में बदलाव कर सकती है जिससे मॉडल अधिक स्मार्ट, अधिक permissive, अधिक cautious, या तीनों एक साथ महसूस हो सकता है।

यह उन उपयोगकर्ताओं के लिए महत्वपूर्ण है जो समय के साथ टूल्स की तुलना करते हैं। इमेज AI में प्रदर्शन स्थिर नहीं होता। जो मॉडल कुछ महीने पहले स्पष्ट रूप से पीछे दिख रहा था, वह यदि उसकी कमजोरियाँ सीमित थीं और उत्पाद टीमों ने उन्हें ठीक करने पर ध्यान दिया, तो जल्दी ही नेता बन सकता है।

सिर्फ दिखावे से आगे, enterprise value अब अधिक साफ़ है

स्रोत पाठ एक व्यापक निष्कर्ष की ओर इशारा करता है: इमेज मॉडल अब novelty से अधिक utility के आधार पर आँके जा रहे हैं। OpenAI पहले ही यह विचार ला चुका था कि ChatGPT Images 2.0 संदर्भ और वास्तविक डेटा का उपयोग पहले से बेहतर कर सकता है। यह तुलना उस तर्क को मानक इमेज-जनरेशन कार्यों तक बढ़ाती है और संकेत देती है कि नया मॉडल advanced features के लिए core quality की बलि नहीं दे रहा।

यह महत्वपूर्ण है क्योंकि व्यवसायों और पेशेवरों को हर visual task के लिए अलग टूल नहीं चाहिए। वे ऐसा एक सिस्टम चाहते हैं जो ideation, text-heavy graphics, और context-rich generation को बिना लगातार prompt repair के संभाल सके। अगर ZDNET के परीक्षण प्रतिनिधि हैं, तो ChatGPT Images 2.0 उसी all-purpose भूमिका के करीब पहुँच रहा है।

लेख यह भी नोट करता है कि naming और packaging खुद समस्या का हिस्सा बनते जा रहे हैं। उपयोगकर्ताओं से अपेक्षा की जाती है कि वे कई AI प्लेटफॉर्म्स पर overlapping product labels, modes, और versions को समझते रहें। यह भ्रम केवल cosmetic नहीं है। इससे खरीदारों, टीमों, और non-expert उपयोगकर्ताओं के लिए यह समझना कठिन हो जाता है कि वास्तव में क्या सुधरा है और वे किस क्षमता का परीक्षण कर रहे हैं।

Anthropic ने अमेरिकी आदेश के बाद Fable 5 और Mythos 5 निलंबित किए

Anthropic ने राष्ट्रीय सुरक्षा चिंताओं और कथित jailbreak जोखिम से जुड़े एक अमेरिकी सरकारी आदेश के बाद अपने नए Fable 5 और Mythos 5 मॉडल्स तक ग्राहकों की पहुंच काट दी है।

Read article

सावधानी: निजीकरण गोपनीयता समस्या बन सकता है

स्रोत लेख की सबसे गंभीर चेतावनी इमेज गुणवत्ता के बारे में नहीं है। ZDNET ने कहा कि Gemini का “personalization surprise” गोपनीयता चिंताएँ उठाता है। हालांकि दिए गए पाठ में अंतिम उदाहरण का विवरण नहीं है, यह स्पष्ट है कि तुलना के सबसे उल्लेखनीय निष्कर्षों में से एक ऐसा व्यवहार था जो “freaky and uncool” लगा।

यह चेतावनी इसलिए ध्यान देने योग्य है क्योंकि इमेज मॉडल अधिक संदर्भ-जागरूकता और उपयोगकर्ता डेटा के साथ गहरे एकीकरण की ओर बढ़ रहे हैं। वही क्षमता जो मॉडल को अधिक प्रासंगिक, अनुकूलित परिणाम बनाने में मदद करती है, यदि वह बहुत अधिक जानने, बहुत अधिक अनुमान लगाने, या स्पष्ट अपेक्षा के बिना निजीकरण करने लगे, तो उपयोगकर्ताओं को असहज भी कर सकती है।

यह शायद consumer AI प्रतिस्पर्धा की अगली बड़ी दरारों में से एक बनने जा रहा है। सटीकता और रचनात्मकता अब भी मायने रखती हैं, लेकिन भरोसा भी उतना ही महत्वपूर्ण होता जा रहा है। जो मॉडल intrusive महसूस होता है, वह तकनीकी रूप से अच्छा होने पर भी पीछे रह सकता है।

यह परीक्षण वास्तव में क्या बताता है

बड़ा चित्र यह है कि इमेज जनरेशन अधिक परिपक्व चरण में प्रवेश कर रही है। अब मुकाबला केवल इस बात पर नहीं है कि कौन सबसे सुंदर इमेज बना सकता है। यह इस पर है कि कौन प्रणाली इरादे को भरोसेमंद आउटपुट में बदल सकती है, सीमाएँ बनाए रख सकती है, और उपयोगकर्ता की सहजता की सीमाएँ पार किए बिना ऐसा कर सकती है।

दिए गए स्रोत पाठ के आधार पर, OpenAI फिलहाल इस मोर्चे पर आगे बढ़त बना रहा है। ChatGPT Images 2.0 ने अपनी पिछली कमजोरियों में से पर्याप्त सुधार कर लिया है, जिससे वह इस विशेष तुलना में एक मजबूत Google प्रतिद्वंद्वी से आगे निकल गया। लेकिन यही परीक्षण यह भी दिखाता है कि उपयोगकर्ता अपेक्षाएँ कितनी तेजी से बढ़ रही हैं। मजबूत visuals अब आधारभूत अपेक्षा हैं। प्रॉम्प्ट अनुशासन, पढ़ने योग्य टेक्स्ट, संदर्भ-जागरूकता, और गोपनीयता व्यवहार नए मानदंड बन रहे हैं।

इसलिए यह किसी एक दिन की जीत से अधिक, बाजार की दिशा का संकेत है। इमेज AI में विजेता केवल बेहतर चित्र नहीं बनाएँगे। वे अधिक भरोसेमंद परिणाम देंगे और उपयोगकर्ताओं को यह विश्वास भी देंगे कि उन परिणामों को कैसे आकार दिया गया है।

यह लेख ZDNET की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Congress lets decades-old spying law lapse amid Trump

कांग्रेस के विस्तार को मंजूरी न देने के बाद Section 702 समाप्त होने की स्थिति में

2008 के बाद पहली बार, Foreign Intelligence Surveillance Act की Section 702 के समाप्त होने की संभावना है, क्योंकि कांग्रेस एक अल्पकालिक विस्तार भी पारित नहीं कर सकी।

Read article

Originally published on zdnet.com