OpenAI étend ses outils de provenance des médias IA avec C2PA et SynthID

OpenAI a annoncé un effort plus large en matière de provenance des contenus, visant à rendre les médias générés par l’IA plus faciles à identifier et à vérifier sur différentes plateformes. Cette initiative combine trois éléments : un alignement plus poussé sur la norme de provenance C2PA, l’ajout du filigrane SynthID de Google pour les images, et un premier outil public de vérification permettant de vérifier si des images proviennent d’OpenAI.

Pourquoi la provenance devient une infrastructure centrale de l’IA

À mesure que les outils de génération d’images et de voix s’intègrent aux flux de travail ordinaires de communication et de publication, la provenance est passée d’un sujet technique de niche à une exigence de confiance et de sécurité. Le cadrage d’OpenAI est que les utilisateurs ont besoin de davantage de contexte sur l’origine des contenus, la manière dont ils ont été créés ou modifiés, et sur leur conformité à ce qu’ils prétendent être. Ce contexte est important non seulement pour les chercheurs et les plateformes, mais aussi pour les utilisateurs ordinaires qui tentent d’évaluer ce qu’ils voient en ligne.

L’entreprise présente ses derniers changements comme faisant partie d’une approche multicouche plutôt que comme une solution technique unique. Cette distinction est importante. Les systèmes de provenance doivent survivre aux transferts entre plateformes, aux modifications de fichiers et aux différents canaux de diffusion, ce qui signifie que les métadonnées sont utiles, mais insuffisantes. Des signaux durables et des standards lisibles doivent tous deux faire partie de la pile.

Google et OpenAI révèlent des opérations distinctes d’abus de l’IA liées à la Chine

Google a engagé une action en justice au sujet d’un réseau de fraude présumé assisté par l’IA, tandis qu’OpenAI a déclaré avoir perturbé deux groupes d’influence liés à la Chine visant les débats américains et les récits sur les infrastructures.

Read article

Conformité C2PA et pourquoi elle compte

OpenAI a indiqué travailler sur les normes de provenance depuis 2024, lorsqu’elle a commencé à ajouter des Content Credentials aux images générées par DALL·E 3, puis plus tard à ImageGen et Sora. Elle a aussi rejoint le comité directeur de la Coalition for Content Provenance and Authenticity, ou C2PA, le groupe industriel à l’origine d’une norme technique ouverte pour la provenance.

La nouvelle étape est qu’OpenAI est devenue un C2PA Conforming Generator Product. En pratique, cela offre aux autres plateformes un moyen standardisé de lire, conserver et transmettre les données de provenance associées aux contenus générés par OpenAI. L’argument d’OpenAI est que la provenance ne fonctionne que si elle survit au-delà de la première plateforme où le contenu est créé. La conformité vise à rendre ce relais plus fiable.

Le modèle technique de C2PA repose sur des métadonnées et des signatures cryptographiques. L’objectif n’est pas d’affirmer qu’un contenu est vrai, mais de préserver des informations sur son origine et ses modifications afin que les utilisateurs et systèmes en aval puissent prendre de meilleures décisions. Pour les journalistes, les plateformes et les chercheurs, ce type de contexte peut être utile sur le plan opérationnel même lorsqu’il n’est pas निर्णant à lui seul.

Ajout de SynthID et d’une couche de vérification publique

OpenAI ajoute également le filigrane SynthID de Google aux images, élargissant ainsi son approche de la provenance au-delà des métadonnées. Le filigrane est conçu pour fournir un signal plus durable, capable de rester utile à travers les plateformes et les transformations. OpenAI a présenté cela comme faisant partie d’une approche multiplateforme élaborée en partenariat avec Google, ce qui est notable en soi compte tenu de la rareté des alignements entre grands rivaux de l’IA sur des mécanismes techniques de confiance.

Le troisième élément est un aperçu d’un outil public de vérification que les utilisateurs peuvent employer pour vérifier si des images proviennent d’OpenAI. S’ils sont largement adoptés et suffisamment fiables pour un usage réel, de tels outils pourraient offrir aux éditeurs, aux modérateurs et au public un moyen plus direct d’examiner la provenance des médias sans dépendre uniquement des systèmes internes des plateformes.

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0 ouvre un jeu de données robotique de 2 000 heures

X Square Robot a publié XRZero-G0 et un jeu de données multimodal de 2 000 heures afin de réduire la quantité de données réelles de robots nécessaire aux systèmes d’IA incarnée.

Read article

Les limites et la portée de cette évolution

Aucun de ces outils n’est une solution miracle. Les métadonnées peuvent être supprimées, les filigranes peuvent rencontrer des défis de robustesse, et les outils de vérification n’aident que si les gens savent qu’ils existent et font confiance aux résultats. L’annonce d’OpenAI ne prétend pas le contraire. Elle décrit plutôt la provenance comme un problème d’écosystème nécessitant des normes ouvertes, des signaux interopérables et une large reconnaissance par les plateformes.

C’est un changement d’accent significatif. Le débat autour de l’IA générative s’est souvent concentré sur les capacités des modèles, tandis que le travail sur la provenance a pris du retard en matière de visibilité. OpenAI signale désormais que l’identification et la vérification doivent mûrir en même temps que la génération elle-même. Le choix de combiner la conformité C2PA, le filigrane SynthID et une expérience de vérification accessible au public suggère que l’entreprise considère l’infrastructure de confiance comme une question de produit et de politique, et non comme une simple case de conformité.

Si cette approche gagne du terrain sur davantage de plateformes et d’outils, elle pourrait rendre les médias IA plus faciles à contextualiser au moment du partage, plutôt qu’après l’apparition d’un litige. Cela n’éliminerait pas la désinformation ni la tromperie, mais cela pourrait rendre la provenance plus lisible et plus portable. Dans un environnement médiatique de plus en plus façonné par des systèmes génératifs, c’est une avancée importante.

Cet article est basé sur un reportage d’OpenAI. Lire l’article original.

Originally published on openai.com

OpenAI renforce sa stratégie de provenance des contenus avec la conformité C2PA, SynthID et un aperçu public de vérification