OpenAI యొక్క తాజా image model ఒక పెద్ద తేడాను తగ్గించినట్లుగా కనిపిస్తోంది
ZDNET నిర్వహించిన image-generation పరీక్షల తాజా రౌండ్, OpenAI image quality మరియు prompt handlingలో గణనీయమైన పురోగతి సాధించిందని సూచిస్తోంది. ఏప్రిల్ 27న ప్రచురితమైన తొమ్మిది-పరీక్షల పోలికలో ChatGPT Images 2.0 97% స్కోరు సాధించింది, Google Gemini యొక్క Nano Banana 85% సాధించింది. గతంలో జరిగిన పోలికలో ChatGPT, Google యొక్క image system కంటే చాలా వెనుకబడి ఉండటం గమనార్హం. ఈసారి ర్యాంకింగ్ తలకిందులైంది.
మూల వ్యాసం ఈ ఫలితాన్ని కేవలం model-vs.-model పోటీగా కాకుండా చూపిస్తోంది. OpenAI యొక్క అప్డేట్ కేవలం క్రమేపీ మెరుగుదల కాదు, రోజువారీ వినియోగంలో ముఖ్యమైన అంశాల్లో గణనీయమైన మెరుగుదల అని అది వాదిస్తోంది: సూచనలను అనుసరించడం, image లోని text ను నిర్వహించడం, మరియు output ను అసలు prompt కు అనుగుణంగా ఉంచడం. ఇవే సాధారణంగా ఆకర్షణీయమైన demo మరియు నిజమైన పనికి నమ్మదగిన సాధనం మధ్య తేడాను నిర్ణయించే అంశాలు.
ఈ ఫలితం ఎందుకు ప్రత్యేకంగా నిలుస్తోంది
Image generation AIలో అత్యంత వేగంగా కదిలే రంగాల్లో ఒకటిగా మారింది. చాలా systems ఇప్పుడు ఆకర్షణీయమైన చిత్రాలు రూపొందించగలుగుతున్నప్పటికీ, consistency ఇంకా కఠినమైన సమస్యగానే ఉంది. వినియోగదారులు కేవలం చూడడానికి బాగున్నదే కాదు. సందర్భాన్ని అర్థం చేసుకునే, పరిమితులను పాటించే, మరియు అడిగినదానిని మించి దారి తప్పని system ను కోరుకుంటున్నారు.
ఇచ్చిన మూల పాఠ్యం ప్రకారం, ChatGPT Images 2.0 తన బలమైన పురోగతిని ఇక్కడే చూపించింది. model “dramatically” మెరుగుపడిందని ZDNET తెలిపింది, ముఖ్యంగా context awareness మెరుగైనదని పేర్కొంది. అలాగే article text rendering పై దృష్టి సారించింది, ఇది image models చారిత్రకంగా ఇబ్బంది పడిన రంగం. ఒక model promptకు నిబద్ధంగా ఉండి imageలో చదవదగిన, సరైన textను ఉంచగలిగితే, అది presentations, mockups, diagrams, విద్యా visuals, మరియు తేలికపాటి design tasks కోసం మరింత ఉపయోగకరంగా మారుతుంది.
Google యొక్క Nano Banana ఈ పోలికలో పూర్తిగా కూలిపోలేదు. 85% స్కోరు ఇంకా సామర్థ్యవంతమైన system ను సూచిస్తోంది. కానీ report ప్రకారం అది prompt discipline మరియు text handlingలో తడబడింది, ఇవి సాధారణ వినియోగాన్ని దాటి త్వరగా నిర్ణయాత్మక లోపాలుగా మారవచ్చు. ప్రాయోగికంగా, వినియోగదారు Google model నుండి ఒక ఆకర్షణీయమైన image పొందవచ్చు, కానీ దాన్ని సరిదిద్దడానికి లేదా మళ్లీ నడిపించడానికి ఎక్కువ సమయం ఖర్చు చేయాల్సి రావచ్చు.





