El último modelo de imagen de OpenAI parece haber cerrado una brecha importante
Una nueva ronda de pruebas de generación de imágenes de ZDNET sugiere que OpenAI ha dado un salto significativo en calidad de imagen y manejo de prompts. En una comparación de nueve pruebas publicada el 27 de abril, ChatGPT Images 2.0 obtuvo un 97%, superando a Nano Banana de Google Gemini, que consiguió un 85%. El resultado importa porque una comparación anterior había dejado a ChatGPT claramente por detrás del sistema de imágenes de Google. Esta vez, la clasificación se invirtió.
El artículo de origen presenta el resultado como algo más que un simple duelo modelo contra modelo. Sostiene que la actualización de OpenAI no solo es mejor de forma incremental, sino que ha mejorado de manera espectacular en áreas que importan en el uso cotidiano: seguir instrucciones, manejar texto dentro de las imágenes y mantener las salidas alineadas con el prompt original. Son exactamente las tareas que suelen separar una demo llamativa de una herramienta en la que la gente puede confiar para trabajo real.
Por qué este resultado destaca
La generación de imágenes se ha convertido en uno de los frentes de más rápido avance en IA. Muchos sistemas ya pueden producir imágenes atractivas, pero la consistencia sigue siendo un problema más difícil. Los usuarios no solo quieren algo visualmente impactante. Quieren un sistema que entienda el contexto, obedezca las restricciones y no se desvíe de lo que se pidió.
Según el texto de la fuente proporcionada, ahí es donde ChatGPT Images 2.0 mostró sus mayores avances. ZDNET dijo que el modelo había mejorado de forma “dramática” y señaló específicamente una mejor conciencia del contexto. El artículo también destacó la renderización de texto, un área en la que históricamente los modelos de imagen han tenido dificultades. Si un modelo puede colocar texto legible y apropiado dentro de una imagen sin dejar de ser fiel al prompt, se vuelve mucho más útil para presentaciones, maquetas, diagramas, recursos visuales educativos y tareas ligeras de diseño.
Gemini Nano Banana no fracasó en la comparación. Una puntuación del 85% sigue sugiriendo un sistema capaz. Pero el informe dice que tropezó con la disciplina del prompt y el manejo del texto, dos debilidades que pueden convertirse rápidamente en un obstáculo fuera de la experimentación casual. En términos prácticos, eso significa que un usuario todavía podría obtener una imagen llamativa del modelo de Google mientras dedica más tiempo a corregirla o a volver a ejecutarla.
Qué cambió desde la ronda anterior
El detalle más llamativo del artículo no es solo que ChatGPT ganó, sino con cuánta claridad lo hizo en comparación con el benchmark anterior. ZDNET dijo que, cuando realizó pruebas similares en diciembre de 2025, Nano Banana obtuvo un 93% mientras que ChatGPT logró un 74%, frenado en parte porque rechazó algunos prompts de cultura pop. En la comparación más reciente, el modelo de OpenAI subió al 97% mientras que la puntuación de Gemini cayó al 85%.
Ese cambio sugiere que pueden estar ocurriendo dos transformaciones a la vez. Primero, OpenAI parece haber mejorado la calidad central de generación y el seguimiento de instrucciones. Segundo, los resultados de benchmarks en esta categoría son frágiles porque dependen en gran medida de la política de prompts, del comportamiento de rechazo y del ajuste del modelo. Una empresa puede cambiar el comportamiento del producto de manera que un modelo parezca más inteligente, más permisivo, más cauteloso o las tres cosas a la vez.
Eso importa para quienes comparan herramientas con el tiempo. En la IA de imágenes, el rendimiento no es estático. Un modelo que hace unos meses parecía claramente rezagado puede convertirse rápidamente en líder si sus debilidades eran estrechas y los equipos de producto se enfocaron en corregirlas.
Más allá de lo vistoso, el valor empresarial es más claro
El texto fuente apunta a una conclusión más amplia: los modelos de imagen se juzgan cada vez más por su utilidad, no por su novedad. OpenAI ya había planteado la idea de que ChatGPT Images 2.0 podía usar el contexto y los datos reales de forma más eficaz que antes. Esta comparación extiende ese argumento a tareas de generación de imágenes más estándar y sugiere que el nuevo modelo no está sacrificando la calidad central por funciones avanzadas.
Esto es importante porque las empresas y los profesionales no quieren herramientas separadas para cada tarea visual. Quieren un sistema que pueda manejar la ideación, los gráficos con mucho texto y la generación rica en contexto sin tener que corregir constantemente el prompt. Si las pruebas de ZDNET son representativas, ChatGPT Images 2.0 se está acercando a ese papel de uso general.
El artículo también señala cómo los nombres y el empaquetado se están convirtiendo en parte del problema. Se espera que los usuarios sigan el ritmo de etiquetas de producto, modos y versiones superpuestos en múltiples plataformas de IA. Esa confusión puede parecer cosmética, pero tiene consecuencias reales. Hace más difícil para compradores, equipos y usuarios sin experiencia saber qué ha mejorado realmente y qué capacidad están probando.
La advertencia: la personalización puede convertirse en un problema de privacidad
La advertencia más seria del artículo original no tiene que ver con la calidad de imagen. ZDNET dijo que la “sorpresa de personalización” de Gemini generó preocupaciones de privacidad. Aunque el texto proporcionado no detalla el ejemplo final, deja claro que uno de los hallazgos más notables de la comparación implicó un comportamiento que se sintió “freaky and uncool”.
Esa advertencia merece atención porque los modelos de imagen avanzan hacia una mayor conciencia del contexto y una integración más profunda con los datos del usuario. La misma capacidad que ayuda a un modelo a producir resultados más relevantes y personalizados también puede inquietar a los usuarios si parece saber demasiado, inferir demasiado o personalizar sin una expectativa clara.
Es probable que esto se convierta en una de las próximas grandes líneas divisorias en la competencia de la IA de consumo. La precisión y la creatividad siguen importando, pero la confianza importa cada vez tanto como ellas. Un modelo que se percibe como invasivo puede perder terreno incluso si rinde bien técnicamente.
Lo que realmente nos dice la prueba
La historia más amplia es que la generación de imágenes está entrando en una fase más madura. El concurso ya no trata solo de quién puede hacer la imagen más bonita. Se trata de qué sistema puede convertir de forma fiable la intención en resultado, preservar las restricciones y hacerlo sin cruzar los límites de comodidad del usuario.
Según el texto de la fuente proporcionada, OpenAI tiene actualmente impulso en ese frente. ChatGPT Images 2.0 parece haber corregido suficientes debilidades anteriores como para superar a un fuerte rival de Google en esta comparación específica. Pero la misma prueba también muestra lo rápido que están subiendo las expectativas de los usuarios. Las imágenes fuertes ya son la línea base. La disciplina del prompt, el texto legible, la conciencia contextual y el comportamiento respecto a la privacidad se están convirtiendo en los nuevos criterios.
Eso hace que esto sea menos una victoria de un solo día y más una señal de hacia dónde va el mercado. Los ganadores en IA de imágenes no solo generarán mejores imágenes. Generarán resultados más confiables mientras transmiten a los usuarios confianza sobre cómo se moldean esos resultados.
Este artículo se basa en un informe de ZDNET. Leer el artículo original.
Originally published on zdnet.com








