OpenAI-யின் சமீபத்திய image model ஒரு முக்கிய இடைவெளியை மூடியதாகத் தெரிகிறது

ZDNET நடத்திய image-generation சோதனைகளின் புதிய சுற்று, OpenAI image quality மற்றும் prompt handling-இல் கணிசமான முன்னேற்றம் செய்துள்ளதாகக் காட்டுகிறது. ஏப்ரல் 27 அன்று வெளியிடப்பட்ட ஒன்பது-சோதனை ஒப்பீட்டில் ChatGPT Images 2.0 97% மதிப்பெண் பெற்றது; Google Gemini-யின் Nano Banana 85% பெற்றது. இதற்கு முன்பு நடந்த ஒப்பீட்டில் ChatGPT, Google-ன் image system-க்குப் பின்னால் இருந்தது. இம்முறை நிலைமையே புரண்டது.

மூலக் கட்டுரை இந்த முடிவை வெறும் model-vs.-model போட்டியாக அல்லாமல் பார்க்கிறது. OpenAI-யின் புதுப்பிப்பு சிறிதளவு மேம்பாடு மட்டும் அல்ல, அன்றாட பயன்பாட்டில் முக்கியமான பகுதிகளில் கணிசமாக சிறந்தது என அது வாதிடுகிறது: வழிமுறைகளைப் பின்பற்றுதல், image-உள்ளேயான text-ஐ கையாளுதல், மற்றும் output-ஐ மூல prompt-க்கு ஏற்ப வைத்திருத்தல். இவையே பெரும்பாலும் கவர்ச்சியான demo-வும் நம்பகமாகப் பயன்படுத்தக்கூடிய கருவியும் இடையே வித்தியாசத்தை உருவாக்கும் அம்சங்கள்.

இந்த முடிவு ஏன் தனித்திருக்கிறது

Image generation AI-யின் அதிவேகமாக நகரும் முனைகளில் ஒன்றாகிவிட்டது. பல systems இப்போது அழகான படங்களை உருவாக்க முடிகிறது, ஆனால் consistency இன்னும் கடினமான சவாலாகவே உள்ளது. பயனர்கள் கண்ணுக்கு இனிமையான ஒன்றை மட்டும் விரும்பவில்லை. சூழலைப் புரிந்துகொள்கின்ற, கட்டுப்பாடுகளைப் பின்பற்றுகின்ற, மற்றும் கோரியதிலிருந்து விலகாத system-ஐ அவர்கள் விரும்புகிறார்கள்.

வழங்கப்பட்ட மூலப் பொருளின் படி, ChatGPT Images 2.0 தனது வலுவான முன்னேற்றத்தை இங்கேதான் காட்டியது. அந்த model “dramatically” மேம்பட்டதாக ZDNET கூறியது, மேலும் குறிப்பாக context awareness சிறந்ததாக குறிப்பிட்டது. text rendering-ஐயும் கட்டுரை வலியுறுத்தியது; image models வரலாற்றாகச் சிரமப்பட்ட பகுதி அது. ஒரு model prompt-க்கு உண்மையாக இருந்தபடி image-க்குள் படிக்கக்கூடிய, பொருத்தமான text-ஐ இட முடிந்தால், அது presentations, mockups, diagrams, கல்வி visuals, மற்றும் இலகுரக design tasks-க்கு மிகவும் பயனுள்ளதாகிறது.

Google-ன் Nano Banana இந்த ஒப்பீட்டில் முற்றிலும் தோல்வியடையவில்லை. 85% மதிப்பெண் இன்னும் திறனுள்ள system-ஐச் சுட்டுகிறது. ஆனால் report-இன் படி அது prompt discipline மற்றும் text handling-இல் தடுமாறியது; casual experimentation-ஐத் தாண்டிய பயன்பாட்டில் அவை விரைவில் தீர்மானிக்கக்கூடிய பலவீனங்களாக மாறுகின்றன. நடைமுறையில், பயனருக்கு Google-ன் model ஒரு striking image-ஐ வழங்கலாம், ஆனால் அதைத் திருத்த அல்லது மீண்டும் இயக்க அதிக நேரம் தேவைப்படலாம்.