OpenAI चे नवीनतम image model एक मोठी दरी कमी करत असल्याचे दिसते

ZDNET ने केलेल्या image-generation चाचण्यांच्या नव्या फेरीतून असे सूचित होते की OpenAI ने image quality आणि prompt handling मध्ये लक्षणीय झेप घेतली आहे. 27 एप्रिल रोजी प्रकाशित झालेल्या नऊ-चाचण्यांच्या तुलनेत ChatGPT Images 2.0 ला 97% गुण मिळाले, तर Google Gemini च्या Nano Banana ला 85% गुण मिळाले. यापूर्वीच्या तुलनेत ChatGPT, Google च्या image system पेक्षा बराच मागे होता. यावेळी क्रम उलटला.

मूळ लेख हा निकाल केवळ model-vs.-model स्पर्धा म्हणून पाहत नाही. तो असा युक्तिवाद करतो की OpenAI चे अपडेट फक्त टप्प्याटप्प्याने झालेली सुधारणा नाही, तर रोजच्या वापरासाठी महत्त्वाच्या बाबींमध्ये नाट्यमय प्रगती आहे: सूचना पाळणे, image मधील text हाताळणे, आणि output मूळ prompt शी सुसंगत ठेवणे. हीच ती कामे आहेत जी अनेकदा एक आकर्षक demo आणि प्रत्यक्ष कामासाठी वापरता येईल अशा भरोसेमंद tool मध्ये फरक निर्माण करतात.

हा निकाल का वेगळा दिसतो

Image generation हे AI मधील सर्वात वेगाने बदलणाऱ्या आघाड्यांपैकी एक बनले आहे. अनेक systems आता आकर्षक चित्रे तयार करू शकतात, पण consistency अजूनही कठीण समस्या आहे. वापरकर्त्यांना फक्त दिसायला चांगले काहीतरी नको असते. त्यांना असा system हवा असतो जो context समजतो, constraints पाळतो, आणि मागणीपासून भरकटत नाही.

दिलेल्या source text नुसार, ChatGPT Images 2.0 ने आपली सर्वात मोठी सुधारणा इथेच दाखवली. ZDNET ने model “dramatically” सुधारल्याचे म्हटले आणि विशेषतः context awareness चांगली असल्याचे नमूद केले. article ने text rendering वरही भर दिला, जो image models साठी ऐतिहासिकदृष्ट्या अडचणीचा भाग राहिला आहे. जर एखादा model prompt प्रति प्रामाणिक राहून image मध्ये वाचता येईल असा, योग्य text बसवू शकतो, तर तो presentations, mockups, diagrams, शैक्षणिक visuals, आणि हलक्या design tasks साठी खूपच उपयोगी ठरतो.

Google चा Nano Banana या तुलनेत पूर्णपणे कोसळला नाही. 85% गुण अजूनही एक सक्षम system सूचित करतात. पण अहवाल म्हणतो की त्याने prompt discipline आणि text handling मध्ये अडखळले, आणि हीच कमतरता casual experimentation च्या बाहेर लवकरच निर्णायक ठरू शकते. प्रत्यक्षात याचा अर्थ असा की वापरकर्त्याला Google च्या model कडून आकर्षक image मिळू शकते, पण ती सुधारण्यात किंवा पुन्हा चालवण्यात अधिक वेळ लागू शकतो.