OpenAI-এর সর্বশেষ image model একটি বড় ফাঁক ঘুচিয়েছে বলে মনে হচ্ছে
ZDNET পরিচালিত image-generation পরীক্ষার নতুন পর্ব থেকে বোঝা যায়, OpenAI image quality এবং prompt handling-এ বড় অগ্রগতি করেছে। ২৭ এপ্রিল প্রকাশিত নয়-পরীক্ষার তুলনায় ChatGPT Images 2.0 পেয়েছে ৯৭%, আর Google Gemini-র Nano Banana পেয়েছে ৮৫%। আগের একটি তুলনায় ChatGPT, Google-এর image system-এর চেয়ে অনেক পিছিয়ে ছিল। এবার অবস্থান উল্টে গেছে।
উৎস নিবন্ধটি এই ফলাফলকে কেবল model-vs.-model প্রতিযোগিতা হিসেবে নয়, আরও বিস্তৃতভাবে দেখে। এতে যুক্তি দেওয়া হয়েছে যে OpenAI-এর আপডেট শুধু ধাপে ধাপে উন্নতি নয়, বরং দৈনন্দিন ব্যবহারের জন্য গুরুত্বপূর্ণ ক্ষেত্রগুলোতে নাটকীয় অগ্রগতি: নির্দেশনা অনুসরণ, image-এর মধ্যে text সামলানো, এবং output-কে মূল prompt-এর সঙ্গে সামঞ্জস্যপূর্ণ রাখা। এগুলোই প্রায়ই ঝলমলে demo আর বাস্তব কাজের জন্য নির্ভরযোগ্য টুলের মধ্যে পার্থক্য গড়ে দেয়।
এই ফলাফল কেন চোখে পড়ার মতো
Image generation AI-এর সবচেয়ে দ্রুত বদলানো ক্ষেত্রগুলোর একটি হয়ে উঠেছে। অনেক system এখন আকর্ষণীয় ছবি তৈরি করতে পারে, কিন্তু consistency এখনও কঠিন সমস্যা। ব্যবহারকারীরা শুধু সুন্দর কিছু চান না। তারা এমন system চান যা context বোঝে, constraints মানে, এবং চাওয়া বিষয় থেকে সরে যায় না।
দেওয়া source text অনুযায়ী, ChatGPT Images 2.0 এখানেই সবচেয়ে শক্তিশালী অগ্রগতি দেখিয়েছে। ZDNET বলেছে modelটি “dramatically” উন্নত হয়েছে এবং বিশেষ করে context awareness-এর কথা উল্লেখ করেছে। article text rendering-কেও জোর দিয়েছে, যা image model-গুলোর ঐতিহাসিক দুর্বলতার একটি। যদি একটি model prompt-এর সঙ্গে মিল রেখে image-এর মধ্যে পড়া যায় এমন, উপযুক্ত text বসাতে পারে, তাহলে তা presentations, mockups, diagrams, educational visuals, এবং হালকা design tasks-এর জন্য অনেক বেশি কার্যকর হয়ে ওঠে।
Google-এর Nano Banana তুলনায় ভেঙে পড়েনি। ৮৫% স্কোর এখনও সক্ষম একটি system-এর ইঙ্গিত দেয়। কিন্তু report বলছে, এটি prompt discipline এবং text handling-এ হোঁচট খেয়েছে, যা casual experimentation ছাড়িয়ে ব্যবহারিক ক্ষেত্রে দ্রুত deal-breaker হয়ে উঠতে পারে। বাস্তবে এর মানে হলো, একজন ব্যবহারকারী Google-এর model থেকে একটি আকর্ষণীয় image পেতে পারেন, কিন্তু সেটি ঠিক করতে বা আবার চালাতে আরও সময় লাগতে পারে।





