OpenAI谋求掌控AI安全栈

OpenAI宣布了收购Promptfoo的计划,Promptfoo是一家AI安全初创公司,专门识别和修复AI应用程序在投入生产前的漏洞。该协议标志着OpenAI的重大战略扩展,OpenAI历来专注于构建基础模型,但现在正在深入企业安全基础设施领域。

Promptfoo平台允许开发者对其AI应用程序执行自动化红队测试,模拟对抗性提示、提示注入攻击和越狱尝试。它生成有关失败模式的详细报告并建议修复——本质上是为任何建立在大语言模型之上的系统提供连续安全测试层。

为什么这项收购重要

随着企业越来越多地部署具有敏感数据和外部工具访问权限的AI代理,AI系统的攻击面大幅扩大。提示注入——外部内容中隐藏的恶意指令劫持AI代理行为——已成为生产AI部署中最严重且最容易被忽视的威胁之一。

Promptfoo专门为应对这些风险而构建。与通用安全扫描仪不同,它理解AI行为的语义学,测试模型在面对对抗性用户输入时是否遵循系统提示指令,以及是否可被操纵泄露机密数据或执行无意操作。

对于OpenAI而言,此次收购有多个目的。它提供了对GPT-4o和o3等模型漏洞研究的直接访问。在安全团队以更严格的标准审查AI部署的时刻,它增加了企业信誉。它将OpenAI定位为不仅构建AI应用程序,还保护AI应用程序的一站式服务。

日益扩大的企业安全差距

AI安全市场在过去18个月中爆炸式增长。包括HiddenLayer、Robust Intelligence和Adversa AI在内的数十家初创公司已经出现,以填补AI能力与AI安全之间的空白。传统应用安全工具对AI特定攻击向量基本上无法察觉,导致企业不得不从开源项目和手动红队演习中拼凑测试框架。

Promptfoo在这个领域位置本身为开发者友好选项:开源核心、CLI优先工作流和与流行AI框架的深度集成。该项目在获得风险投资融资并推出企业级产品前,已在GitHub上积累了相当大的社区热度。

对更广泛生态系统的影响

此次收购引发了关于AI安全工具竞争动态的问题。如果OpenAI将Promptfoo的功能直接集成到其开发者平台中,专注于OpenAI模型的第三方安全工具可能会处于不利地位。使用其他供应商——Anthropic、Google、Mistral——的企业将密切关注Promptfoo的工具在收购后是否保持供应商无关。

目前,OpenAI表示Promptfoo团队将继续以显著的自主权运营,专注于在公司整个产品表面扩展自动化安全测试。预计收购将在标准监管审查后完成。

该协议强调了一个更广泛的趋势:随着AI从实验阶段发展为关键基础设施,掌控安全层的公司在整个栈中获得不成比例的杠杆作用。

本文基于OpenAI的报道。阅读原始文章

Originally published on openai.com