वेगवेगळ्या platforms वर AI-generated media ओळखणे आणि पडताळणे सोपे व्हावे यासाठी OpenAI ने content provenance संदर्भात एक व्यापक उपक्रम जाहीर केला आहे. या हालचालीत तीन घटक आहेत: C2PA provenance standard शी अधिक सखोल जुळवणी, प्रतिमांसाठी Google चे SynthID watermarking जोडणे, आणि प्रतिमा OpenAI मधून आल्या आहेत का हे तपासण्यासाठी एक प्रारंभिक public verification tool.

Provenance core AI infrastructure का बनत आहे

जेव्हा image आणि audio generation tools सामान्य communication आणि publishing workflows चा भाग बनत आहेत, तेव्हा provenance हा एक संकीर्ण technical विषय न राहता trust आणि safety requirement बनला आहे. content कुठून आले, ते कसे तयार किंवा संपादित झाले, आणि ते जे सांगते आहे ते खरोखर तसे आहे का, याबद्दल लोकांना अधिक context हवी आहे, असे OpenAI चे म्हणणे आहे. हा context केवळ researchers आणि platforms साठीच नाही, तर ऑनलाइन ते जे पाहत आहेत त्याचा निर्णय घेण्याचा प्रयत्न करणाऱ्या सामान्य users साठीही महत्त्वाचा आहे.

कंपनी आपल्या ताज्या बदलांना एकाच technical fix ऐवजी multi-layered approach चा भाग म्हणून मांडत आहे. हा फरक महत्त्वाचा आहे. Provenance systems ना platform transfers, file edits, आणि विविध distribution channels मधून टिकून राहावे लागते, म्हणजेच metadata उपयुक्त असले तरी पुरेसे नाही. Durable signals आणि readable standards दोन्ही stack चा भाग असले पाहिजेत.

C2PA अनुपालन आणि त्याचे महत्त्व

OpenAI ने सांगितले की ते 2024 पासून provenance standards वर काम करत आहे, जेव्हा DALL·E 3 ने तयार केलेल्या images मध्ये Content Credentials जोडण्यास सुरुवात झाली, आणि नंतर ते ImageGen आणि Sora पर्यंत वाढवले गेले. कंपनीने Coalition for Content Provenance and Authenticity, म्हणजेच C2PA, च्या steering committee मध्येही सहभाग घेतला, ही provenance साठी open technical standard मागे असलेली industry group आहे.

नवीन पाऊल म्हणजे OpenAI आता एक C2PA Conforming Generator Product बनले आहे. प्रत्यक्षात, यामुळे OpenAI-generated content शी जोडलेल्या provenance data ला इतर platforms साठी standardized पद्धतीने वाचणे, जतन करणे, आणि पुढे पाठवणे शक्य होते. content तयार झालेल्या पहिल्या platform पलीकडेही provenance टिकून राहिली पाहिजे, असा OpenAI चा युक्तिवाद आहे. तो handoff अधिक विश्वासार्ह करण्यासाठी conformance उद्दिष्ट ठेवते.

C2PA चे technical model metadata आणि cryptographic signatures वर आधारित आहे. content खरे आहे असे घोषित करणे हा हेतू नाही, तर origin आणि edits विषयीची माहिती जतन करणे, जेणेकरून downstream users आणि systems अधिक informed decisions घेऊ शकतील. Journalists, platforms, आणि researchers साठी हा context operationally useful ठरू शकतो, जरी तो एकट्याने अंतिम नसला तरी.

SynthID आणि public verification layer जोडणे

OpenAI आता प्रतिमांसाठी Google चे SynthID watermarking देखील जोडत आहे, ज्यामुळे provenance approach metadata पलीकडे विस्तारित होईल. Watermarking असे डिझाइन केले आहे की ते अधिक durable signal देऊ शकेल, जो platforms आणि transformations across उपयुक्त राहील. Google सोबतच्या partnership मध्ये तयार केलेल्या cross-platform approach चा हा भाग असल्याचे OpenAI ने सांगितले, आणि हे स्वतःच लक्षवेधी आहे, कारण मोठ्या AI rivals कडून technical trust mechanisms वर अशी जुळवणी फार क्वचित दिसते.

तिसरा घटक म्हणजे एक public verification tool चे प्रिव्ह्यू, ज्याचा वापर करून लोक प्रतिमा OpenAI मधून आल्या आहेत का ते तपासू शकतात. जर हे व्यापकपणे स्वीकारले गेले आणि प्रत्यक्ष वापरासाठी पुरेसे विश्वासार्ह झाले, तर publishers, moderators, आणि public ला media provenance तपासण्याचा अधिक थेट मार्ग मिळू शकतो, केवळ पडद्यामागील platform systems वर अवलंबून न राहता.

या बदलाच्या मर्यादा आणि महत्त्व

या tools पैकी कुठलेही silver bullet नाही. Metadata काढून टाकले जाऊ शकते, watermarks ला resilience challenges येऊ शकतात, आणि लोकांना त्याबद्दल माहिती असेल आणि निकालांवर विश्वास असेल तरच verification tools उपयोगी पडतात. OpenAI च्या घोषणेत याच्या विरुद्ध काहीही दावा केलेला नाही. उलट, provenance ला एक ecosystem problem म्हणून वर्णन केले आहे, ज्यासाठी open standards, interoperable signals, आणि platforms कडून व्यापक recognition आवश्यक आहे.

हा भर बदलण्यासारखा आहे. Generative AI भोवतीची चर्चा अनेकदा model capability वर केंद्रित राहिली आहे, तर provenance work visibility मध्ये मागे पडले आहे. OpenAI आता संकेत देत आहे की identification आणि verification यांना generation सोबतच प्रगल्भ व्हावे लागेल. C2PA conformance, SynthID watermarking, आणि public-facing verification experience एकत्र करण्याचा निर्णय दर्शवतो की कंपनी trust infrastructure ला केवळ compliance checkbox नाही, तर product आणि policy issue म्हणून पाहत आहे.

जर हा approach अधिक platforms आणि tools मध्ये traction मिळवू लागला, तर AI media ला शेअर करतानाच त्याचा context समजणे सोपे होऊ शकते, फक्त वाद निर्माण झाल्यावर नाही. यामुळे misinformation किंवा deception संपणार नाही, पण provenance अधिक legible आणि अधिक portable होऊ शकते. Generative systems increasingly ज्या media environment ला आकार देत आहेत, त्यात हे एक महत्त्वाचे पाऊल आहे.

हा लेख OpenAI च्या reporting वर आधारित आहे. मूळ लेख वाचा.

Originally published on openai.com