বিভিন্ন platform জুড়ে AI-generated media শনাক্ত ও যাচাই করা সহজ করতে OpenAI একটি বিস্তৃত content provenance উদ্যোগ ঘোষণা করেছে। এই পদক্ষেপে তিনটি উপাদান রয়েছে: C2PA provenance standard-এর সঙ্গে আরও গভীর সামঞ্জস্য, ছবির জন্য Google-এর SynthID watermarking যোগ করা, এবং ছবিগুলো OpenAI থেকে এসেছে কি না তা যাচাই করার জন্য একটি প্রাথমিক public verification tool।

Provenance কেন core AI infrastructure হয়ে উঠছে

ছবি ও অডিও generation tools যখন সাধারণ communication এবং publishing workflows-এর অংশ হয়ে উঠছে, তখন provenance একটি বিশেষায়িত technical topic থেকে trust এবং safety requirement-এ পরিণত হয়েছে। OpenAI-এর বক্তব্য হলো, content কোথা থেকে এসেছে, কীভাবে তৈরি বা সম্পাদিত হয়েছে, এবং এটি যা দাবি করছে সত্যিই তাই কি না, সে সম্পর্কে মানুষের আরও context দরকার। এই context শুধু researcher এবং platform-এর জন্যই নয়, online-এ তারা যা দেখছে তা বিচার করার চেষ্টা করা সাধারণ ব্যবহারকারীদের জন্যও গুরুত্বপূর্ণ।

কোম্পানি তার সর্বশেষ পরিবর্তনগুলোকে একটি single technical fix-এর বদলে বহু-স্তরবিশিষ্ট approach-এর অংশ হিসেবে উপস্থাপন করছে। এই পার্থক্যটি গুরুত্বপূর্ণ। Provenance systems-কে platform transfer, file edit, এবং নানা distribution channel টিকে থাকতে হয়, যার মানে metadata উপকারী হলেও যথেষ্ট নয়। Durable signals এবং readable standards, দুটোকেই stack-এর অংশ হতে হবে।

C2PA সম্মতি এবং কেন তা গুরুত্বপূর্ণ

OpenAI বলেছে যে 2024 সাল থেকে এটি provenance standards নিয়ে কাজ করছে, যখন DALL·E 3 দিয়ে তৈরি ছবিতে Content Credentials যোগ করা শুরু হয় এবং পরে ImageGen ও Sora-তেও তা বাড়ানো হয়। এটি Coalition for Content Provenance and Authenticity, বা C2PA-র steering committee-তেও যোগ দেয়, যা provenance-এর জন্য একটি open technical standard-এর পেছনের industry group।

নতুন পদক্ষেপটি হলো OpenAI এখন একটি C2PA Conforming Generator Product। বাস্তবে, এর ফলে OpenAI-generated content-এর সঙ্গে যুক্ত provenance data অন্য platforms-এ standardizedভাবে পড়া, সংরক্ষণ করা, এবং এগিয়ে দেওয়া সম্ভব হয়। OpenAI-এর যুক্তি হলো, provenance তখনই কাজ করে যখন এটি content তৈরি হওয়া প্রথম platform-এর বাইরেও টিকে থাকে। Conformance সেই handoff-কে আরও নির্ভরযোগ্য করার জন্য।

C2PA-এর technical model metadata এবং cryptographic signatures-এর ওপর নির্ভর করে। উদ্দেশ্য content-কে সত্য বলে ঘোষণা করা নয়, বরং origin এবং edit সম্পর্কে তথ্য সংরক্ষণ করা, যাতে downstream users এবং systems আরও informed decisions নিতে পারে। Journalists, platforms, এবং researchers-এর জন্য এই ধরনের context operationally useful হতে পারে, যদিও এটি একা চূড়ান্ত প্রমাণ নয়।

SynthID এবং একটি public verification layer যোগ করা

OpenAI ছবির জন্য Google-এর SynthID watermarking-ও যোগ করছে, ফলে provenance approach metadata-এর বাইরে প্রসারিত হচ্ছে। Watermarking এমনভাবে তৈরি করা হয়েছে যাতে এটি একটি আরও durable signal দিতে পারে, যা বিভিন্ন platform এবং transformation-এর মধ্যেও কার্যকর থাকে। OpenAI এটিকে Google-এর সঙ্গে partnership-এ তৈরি cross-platform approach-এর অংশ হিসেবে বর্ণনা করেছে, যা নিজেই উল্লেখযোগ্য, কারণ বড় AI rival-দের technical trust mechanism-এ এই ধরনের সামঞ্জস্য খুবই বিরল।

তৃতীয় উপাদানটি হলো একটি public verification tool-এর preview, যা ব্যবহার করে মানুষ দেখতে পারবে ছবিগুলো OpenAI থেকে এসেছে কি না। এটি যদি ব্যাপকভাবে গ্রহণ করা হয় এবং বাস্তব ব্যবহারের জন্য যথেষ্ট নির্ভরযোগ্য হয়, তাহলে publisher, moderator, এবং সাধারণ মানুষ ব্যাক-এন্ড platform system-এর ওপর শুধু নির্ভর না করে media provenance আরও সরাসরি পরীক্ষা করতে পারবে।

এই পদক্ষেপের সীমা এবং তাৎপর্য

এই toolগুলোর কোনোটিই silver bullet নয়। Metadata সরিয়ে ফেলা যায়, watermark resilience চ্যালেঞ্জের মুখে পড়তে পারে, এবং verification tool তখনই কাজে লাগে যখন মানুষ এগুলো সম্পর্কে জানে এবং ফলাফলে বিশ্বাস করে। OpenAI-এর ঘোষণায় এর বিপরীত কিছু দাবি করা হয়নি। বরং provenance-কে একটি ecosystem problem হিসেবে বর্ণনা করা হয়েছে, যার জন্য open standards, interoperable signals, এবং platform-গুলোর ব্যাপক স্বীকৃতি দরকার।

এটি গুরুত্বের দিক থেকে একটি অর্থবহ পরিবর্তন। Generative AI নিয়ে আলোচনায় প্রায়ই model capability-কে কেন্দ্র করা হয়েছে, আর provenance work দৃশ্যমানতায় পিছিয়ে ছিল। OpenAI এখন ইঙ্গিত দিচ্ছে যে identification এবং verification-কে generation-এর সঙ্গেই পরিপক্ব হতে হবে। C2PA conformance, SynthID watermarking, এবং public-facing verification experience একত্র করার সিদ্ধান্ত দেখায় যে কোম্পানি trust infrastructure-কে শুধু compliance checkbox নয়, বরং product এবং policy issue হিসেবে দেখছে।

এই approach যদি আরও platform এবং tool-এ গতি পায়, তাহলে AI media-কে শেয়ার করার মুহূর্তেই context সহ বুঝতে সহজ হতে পারে, কেবল বিবাদ তৈরি হওয়ার পরে নয়। এতে misinformation বা deception শেষ হবে না, তবে provenance আরও legible এবং আরও portable হতে পারে। Generative systems increasingly যে media environment গঠন করছে, সেখানে এটি একটি গুরুত্বপূর্ণ পদক্ষেপ।

এই নিবন্ধটি OpenAI-এর রিপোর্টিংয়ের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.

Originally published on openai.com