OpenAI 已宣布一项更广泛的内容来源工作,旨在让跨平台识别和验证 AI 生成媒体变得更容易。此举结合了三个要素:更深入地对齐 C2PA 来源标准、为图像加入 Google 的 SynthID 水印,以及推出一款早期的公开验证工具,用于检查图像是否来自 OpenAI。

为什么来源信息正成为核心 AI 基础设施

随着图像和音频生成工具成为日常沟通与出版工作流的一部分,来源信息已经从小众技术话题转变为信任与安全的要求。OpenAI 的表述是,人们需要更多上下文来了解内容来自何处、如何被创建或编辑,以及它是否如其所称。这样的上下文不仅对研究人员和平台重要,对试图判断自己在网上看到什么的普通用户同样重要。

该公司将最新变化定位为多层方法的一部分,而不是单一技术修复。这一区分很重要。来源系统必须能够经受平台迁移、文件编辑以及不同分发渠道的影响,这意味着仅有元数据是有用的,但还不够。耐久信号和可读标准都必须成为技术栈的一部分。

C2PA 合规及其重要性

OpenAI 表示,自 2024 年起就一直参与来源标准工作,当时它开始为 DALL·E 3 生成的图像添加 Content Credentials,后来又扩展到 ImageGen 和 Sora。它还加入了 Content Provenance and Authenticity 联盟,也就是 C2PA 的指导委员会。该行业组织负责制定一项开放的来源技术标准。

新的步骤是,OpenAI 已成为 C2PA Conforming Generator Product。实际而言,这使其他平台能够以标准化方式读取、保存并传递附加在 OpenAI 生成内容上的来源数据。OpenAI 的观点是,来源信息只有在内容离开创建它的首个平台之后仍能保留时才真正有效。合规性旨在让这一交接更可靠。

C2PA 的技术模型依赖元数据和加密签名。其目的不是宣布内容是否真实,而是保留关于来源和编辑的信息,以便下游用户和系统做出更明智的判断。对于记者、平台和研究人员来说,即使这些信息本身并不具备最终定论,这类上下文在操作上仍然很有价值。

加入 SynthID 和公开验证层

OpenAI 还将把 Google 的 SynthID 水印技术加入图像中,把其来源方法从元数据扩展出去。水印旨在提供更持久的信号,使其在不同平台和转换过程中仍然有用。OpenAI 将此描述为与 Google 合作构建的跨平台方法,这一点本身就值得注意,因为主要 AI 竞争对手在技术信任机制上很少达成一致。

第三个要素是一款公开验证工具的预览版,人们可以用它来检查图像是否来自 OpenAI。如果被广泛采用,并且可靠性足以用于真实场景,这类工具可以让出版机构、内容审核人员和公众更直接地查看媒体来源,而不必完全依赖幕后平台系统。

此举的局限与意义

这些工具都不是万能药。元数据可以被移除,水印会面临抗篡改挑战,而验证工具只有在人们知道它们存在并信任结果时才有帮助。OpenAI 的公告并没有声称相反。相反,它把来源信息描述为一个生态系统问题,需要开放标准、可互操作信号以及平台的广泛认知。

这是一种有意义的强调转变。围绕生成式 AI 的讨论往往聚焦于模型能力,而来源工作在可见度上一直落后。OpenAI 现在传递的信息是,识别和验证必须与生成能力同步成熟。将 C2PA 合规、SynthID 水印和面向公众的验证体验结合起来,说明该公司把信任基础设施视为产品和政策问题,而不仅仅是合规清单上的一个勾选项。

如果这种方法在更多平台和工具上获得采用,它可能会让 AI 媒体在分享的当下就更容易被理解,而不必等争议出现后才处理。这不会终结错误信息或欺骗,但可能让来源更加清晰、也更易于携带。在一个日益被生成系统塑造的媒体环境中,这是一项重要进展。

本文基于 OpenAI 的报道。阅读原文

Originally published on openai.com