ChatGPT Images 2.0 కొత్త పరీక్షలో Gemini Nano Bananaను అధిగమించింది

OpenAI యొక్క తాజా image model ఒక పెద్ద తేడాను తగ్గించినట్లుగా కనిపిస్తోంది

ZDNET నిర్వహించిన image-generation పరీక్షల తాజా రౌండ్, OpenAI image quality మరియు prompt handling‌లో గణనీయమైన పురోగతి సాధించిందని సూచిస్తోంది. ఏప్రిల్ 27న ప్రచురితమైన తొమ్మిది-పరీక్షల పోలికలో ChatGPT Images 2.0 97% స్కోరు సాధించింది, Google Gemini యొక్క Nano Banana 85% సాధించింది. గతంలో జరిగిన పోలికలో ChatGPT, Google యొక్క image system కంటే చాలా వెనుకబడి ఉండటం గమనార్హం. ఈసారి ర్యాంకింగ్ తలకిందులైంది.

మూల వ్యాసం ఈ ఫలితాన్ని కేవలం model-vs.-model పోటీగా కాకుండా చూపిస్తోంది. OpenAI యొక్క అప్‌డేట్ కేవలం క్రమేపీ మెరుగుదల కాదు, రోజువారీ వినియోగంలో ముఖ్యమైన అంశాల్లో గణనీయమైన మెరుగుదల అని అది వాదిస్తోంది: సూచనలను అనుసరించడం, image లోని text ను నిర్వహించడం, మరియు output ను అసలు prompt కు అనుగుణంగా ఉంచడం. ఇవే సాధారణంగా ఆకర్షణీయమైన demo మరియు నిజమైన పనికి నమ్మదగిన సాధనం మధ్య తేడాను నిర్ణయించే అంశాలు.

ఈ ఫలితం ఎందుకు ప్రత్యేకంగా నిలుస్తోంది

Image generation AIలో అత్యంత వేగంగా కదిలే రంగాల్లో ఒకటిగా మారింది. చాలా systems ఇప్పుడు ఆకర్షణీయమైన చిత్రాలు రూపొందించగలుగుతున్నప్పటికీ, consistency ఇంకా కఠినమైన సమస్యగానే ఉంది. వినియోగదారులు కేవలం చూడడానికి బాగున్నదే కాదు. సందర్భాన్ని అర్థం చేసుకునే, పరిమితులను పాటించే, మరియు అడిగినదానిని మించి దారి తప్పని system ను కోరుకుంటున్నారు.

ఇచ్చిన మూల పాఠ్యం ప్రకారం, ChatGPT Images 2.0 తన బలమైన పురోగతిని ఇక్కడే చూపించింది. model “dramatically” మెరుగుపడిందని ZDNET తెలిపింది, ముఖ్యంగా context awareness మెరుగైనదని పేర్కొంది. అలాగే article text rendering పై దృష్టి సారించింది, ఇది image models చారిత్రకంగా ఇబ్బంది పడిన రంగం. ఒక model prompt‌కు నిబద్ధంగా ఉండి image‌లో చదవదగిన, సరైన text‌ను ఉంచగలిగితే, అది presentations, mockups, diagrams, విద్యా visuals, మరియు తేలికపాటి design tasks కోసం మరింత ఉపయోగకరంగా మారుతుంది.

Google యొక్క Nano Banana ఈ పోలికలో పూర్తిగా కూలిపోలేదు. 85% స్కోరు ఇంకా సామర్థ్యవంతమైన system ను సూచిస్తోంది. కానీ report ప్రకారం అది prompt discipline మరియు text handling‌లో తడబడింది, ఇవి సాధారణ వినియోగాన్ని దాటి త్వరగా నిర్ణయాత్మక లోపాలుగా మారవచ్చు. ప్రాయోగికంగా, వినియోగదారు Google model నుండి ఒక ఆకర్షణీయమైన image పొందవచ్చు, కానీ దాన్ని సరిదిద్దడానికి లేదా మళ్లీ నడిపించడానికి ఎక్కువ సమయం ఖర్చు చేయాల్సి రావచ్చు.

Visa is handling AI-prompted transactions for OpenAI - but can you trust it?

Visa మరియు OpenAI agentic payments‌ను ముందుకు తీసుకెళ్తున్నాయి

Visa మరియు OpenAI AI-ఆధారిత transactions‌కు guardrails‌తో మద్దతు ఇవ్వడానికి ముందుకు సాగుతున్నాయి; agentic commerce ఒక ప్రధాన payments battleground‌గా మారుతోందని ఇది సూచిస్తుంది.

Read article

మునుపటి రౌండ్ నుంచి ఏమి మారింది

Article‌లో అత్యంత గమనించదగిన విషయం ChatGPT గెలిచిందన్నదే కాదు, మునుపటి benchmarkతో పోలిస్తే అది ఎంత స్పష్టంగా గెలిచిందన్నదే. ZDNET ప్రకారం, 2025 డిసెంబరులో ఇలాంటి పరీక్షలు నిర్వహించినప్పుడు Nano Banana 93% సాధించగా, ChatGPT 74% మాత్రమే సాధించింది, దానికి కొంతవరకు కొన్ని pop-culture prompts‌ను తిరస్కరించడం కారణం. తాజా పోలికలో OpenAI model 97%కి పెరిగింది, Gemini స్కోరు 85%కి పడిపోయింది.

ఈ మార్పు ఒకేసారి రెండు మార్పులు జరిగే అవకాశాన్ని సూచిస్తోంది. మొదట, OpenAI core generation quality మరియు instruction-following‌ను మెరుగుపరచి ఉండవచ్చు. రెండవది, ఈ విభాగంలోని benchmark ఫలితాలు prompt policy, refusal behavior, model tuning‌లపై బాగా ఆధారపడతాయి కాబట్టి అవి స్థిరంగా ఉండవు. ఒక company తన product behavior‌ను మార్చితే, model మరింత తెలివైనదిగా, మరింత permissive‌గా, మరింత cautious‌గా, లేదా ఈ మూడు లక్షణాల సమ్మేళనంగా కూడా అనిపించవచ్చు.

కాలక్రమేణా tools‌ను పోల్చే వినియోగదారులకు ఇది ముఖ్యం. image AIలో performance స్థిరంగా ఉండదు. కొన్ని నెలల క్రితం స్పష్టంగా వెనుకబడి ఉన్న model, దాని బలహీనతలు తక్కువగా ఉండి product teams వాటిని సరిచేయడంపై దృష్టి పెట్టినట్లయితే, త్వరగా నాయకుడిగా మారవచ్చు.

కేవలం ఆకర్షణీయతకే కాదు, enterprise value ఇప్పుడు మరింత స్పష్టమవుతోంది

మూల పాఠ్యం ఒక విస్తృతమైన takeaway‌ను సూచిస్తోంది: image models ఇప్పుడు novelty కంటే utility ఆధారంగా ఎక్కువగా అంచనా వేయబడుతున్నాయి. ChatGPT Images 2.0 context మరియు real data‌ను మునుపటికన్నా మెరుగ్గా ఉపయోగించగలదని OpenAI ఇప్పటికే చెప్పింది. ఈ పోలిక ఆ వాదనను మరింత సాధారణ image-generation పనులకూ విస్తరించి, కొత్త model advanced features కోసం core qualityను త్యాగం చేయడం లేదని సూచిస్తోంది.

ఇది ముఖ్యమైనది, ఎందుకంటే వ్యాపారాలు మరియు నిపుణులు ప్రతి visual task కోసం వేర్వేరు tools‌ను కోరుకోవడం లేదు. ideation, text-heavy graphics, context-rich generation అన్నిటినీ నిరంతరం prompt repair లేకుండా నిర్వహించగల system కావాలి. ZDNET పరీక్షలు ప్రతినిధులైతే, ChatGPT Images 2.0 ఆ all-purpose పాత్రకు దగ్గరవుతోంది.

పేర్లు, packaging కూడా సమస్యలో భాగంగా మారుతున్నాయని article పేర్కొంటోంది. అనేక AI platforms‌లో overlapping product labels, modes, versions‌లను వినియోగదారులు గమనించి ఉండాలి. ఈ గందరగోళం చిన్న cosmetic విషయం అనిపించినా, దాని ప్రభావం నిజమైనది. కొనుగోలుదారులు, బృందాలు, non-expert users‌కు వాస్తవానికి ఏమి మెరుగైంది, వారు ఏ capabilityని పరీక్షిస్తున్నారు అనేది తెలుసుకోవడం కష్టం అవుతుంది.

అమెరికా ఆదేశం తర్వాత Anthropic Fable 5 మరియు Mythos 5ను నిలిపేసింది

జాతీయ భద్రతా ఆందోళనలు మరియు ఒక నివేదిత jailbreak ప్రమాదానికి సంబంధించిన అమెరికా ప్రభుత్వ ఆదేశం తర్వాత Anthropic తన కొత్త Fable 5 మరియు Mythos 5 మోడళ్లకు కస్టమర్ యాక్సెస్‌ను నిలిపేసింది.

Read article

సూచన: personalization privacy సమస్యగా మారవచ్చు

మూల వ్యాసంలోని అత్యంత తీవ్రమైన హెచ్చరిక image quality గురించి కాదు. Gemini యొక్క “personalization surprise” privacy concerns‌ను లేవనెత్తిందని ZDNET తెలిపింది. ఇవ్వబడిన పాఠ్యంలో తుది ఉదాహరణ వివరించబడకపోయినా, పోలికలో అత్యంత గమనించదగిన కనుగొన్న విషయాల్లో ఒకటి “freaky and uncool” అనిపించిన ప్రవర్తన అని స్పష్టంగా ఉంది.

ఈ హెచ్చరిక గమనించదగ్గది, ఎందుకంటే image models మరింత context-aware‌గా, వినియోగదారు dataతో మరింత లోతైన integration‌తో ముందుకు వెళ్తున్నాయి. model‌కు మరింత సంబంధిత, tailored ఫలితాలను ఇవ్వడంలో సహాయపడే అదే సామర్థ్యం, అది అతిగా తెలుసుకున్నట్లుగా, అతిగా ఊహించినట్లుగా, లేదా స్పష్టమైన అంచనాల లేకుండా personalize చేసినట్లుగా అనిపిస్తే వినియోగదారులను అసౌకర్యానికి గురిచేయవచ్చు.

ఇది consumer AI పోటీలో తదుపరి ప్రధాన విభజనలలో ఒకటిగా మారే అవకాశం ఉంది. ఖచ్చితత్వం, సృజనాత్మకత ఇప్పటికీ ముఖ్యమే, కానీ trust కూడా అంతే ముఖ్యం అవుతోంది. intrusive‌గా అనిపించే model, సాంకేతికంగా బాగా పనిచేసినా, వెనక్కి నెట్టబడవచ్చు.

ఈ పరీక్ష నిజంగా ఏమి చెబుతోంది

పెద్ద కథ ఏమిటంటే image generation మరింత పరిపక్వ దశలోకి ప్రవేశిస్తోంది. పోటీ ఇప్పుడు ఎవరు అత్యంత అందమైన image తయారు చేస్తారు అన్నదానిపై మాత్రమే కాదు. ఏ system intent‌ను output‌గా నమ్మకంగా మార్చగలదు, constraints‌ను నిలబెట్టగలదు, మరియు వినియోగదారు comfort lines‌ను దాటకుండా అలా చేయగలదు అన్నదానిపై ఉంది.

ఇచ్చిన మూల పాఠ్యం ప్రకారం, ప్రస్తుతం OpenAIకి ఆ దిశలో momentum ఉంది. ChatGPT Images 2.0 తన మునుపటి బలహీనతలలో చాలావరకు సరిచేసి, ఈ ప్రత్యేక పోలికలో బలమైన Google ప్రత్యర్థిని అధిగమించింది. కానీ అదే test వినియోగదారుల అంచనాలు ఎంత వేగంగా పెరుగుతున్నాయో కూడా చూపుతోంది. బలమైన visuals ఇప్పుడు baseline. prompt discipline, readable text, context awareness, privacy behavior—all new criteria.

అందుకే ఇది ఒకరోజు విజయోత్సవం కంటే, మార్కెట్ ఎటు వెళ్తుందో సూచించే సంకేతం. image AI విజేతలు కేవలం మెరుగైన చిత్రాలు తయారు చేయరు. వారు మరింత నమ్మదగిన ఫలితాలను తయారు చేసి, ఆ ఫలితాలు ఎలా రూపుదిద్దుకున్నాయో వినియోగదారులకు నమ్మకాన్ని కూడా ఇస్తారు.

ఈ వ్యాసం ZDNET నివేదిక ఆధారంగా ఉంది. మూల వ్యాసాన్ని చదవండి.

Congress lets decades-old spying law lapse amid Trump

పొడిగింపును కాంగ్రెస్ ఆమోదించకపోవడంతో సెక్షన్ 702 గడువు ముగియనుంది

2008 తర్వాత తొలిసారిగా, కాంగ్రెస్ తాత్కాలిక పొడిగింపును కూడా ఆమోదించడంలో విఫలమైనందున, ఫారెన్ ఇంటెలిజెన్స్ సర్వైలెన్స్ యాక్ట్‌లోని సెక్షన్ 702 గడువు ముగియనుంది.

Read article

Originally published on zdnet.com