
Anthropic 受限发布 Mythos,凸显 AI 网络风险进入更严峻阶段
Anthropic 的最新模型 Mythos 仅向少数组织开放,原因是内部和外部测试表明,它能够以比前代模型更高的水平自主利用漏洞
- Anthropic 正通过名为 Project Glasswing 的精选计划限制 Mythos 的访问。
- 内部测试据称发现,该模型能够自主利用漏洞并访问敏感数据。
所有标记为「AI governance」的文章

Anthropic 的最新模型 Mythos 仅向少数组织开放,原因是内部和外部测试表明,它能够以比前代模型更高的水平自主利用漏洞

一份新的 MIT Technology Review Insights 报告认为,政府机构或许更适合采用专门打造的小型语言模型,它们能够在严格的安全、治理和连接性约束下运行。

OpenAI 正在为其 Agents SDK 引入沙盒执行功能,将其定位为帮助企业团队在从原型走向生产时,以更可控风险运行自动化工作流的一种方式。

丰业银行已推出 Scotia Intelligence,这是一个内部 AI 框架,旨在将数据运营、治理和软件工具整合到一个环境中。
一名嫌疑人在据称向萨姆·奥尔特曼位于旧金山的住宅投掷燃烧瓶后被捕,这起事件很快引发了关于 AI 权力、言论与公众焦虑的更大讨论。
Anthropic 将一款强大的新模型限制给少数组织使用的决定,凸显出前沿 AI 的部署正日益受到治理、限制和分阶段开放的塑造。
OpenAI 发布了一份政策蓝图,呼吁针对 AI 生成的儿童性虐待材料更新法律、加强服务提供方报告机制,并为 AI 系统设立安全优先的设计要求。
关于前沿 AI 公司,一场新的争论正在形成:同样的克制,可能会让一个政府感到挫败,却也可能让另一位寻求可信度、可控性和政策一致性的政府更愿意合作。
一款新的企业工具将自己定位为监控和控制自治代理的方式,以帮助企业应对快速上升的影子 AI 问题。
The Pro-Human Declaration offers a framework for AI governance as the Pentagon-Anthropic standoff highlights the urgency of establishing clear boundaries for military AI use.
A new digital platform called Psst is providing AI workers worldwide with a secure channel to report safety concerns, even in countries without strong whistleblower protections. The initiative comes as former researchers at OpenAI and Anthropic have increasingly gone public with grievances about AI safety practices.
The Department of Defense is working to align its artificial intelligence providers around a shared set of standards and ethical baselines. The effort comes as the military rapidly expands its use of AI systems while maintaining its commitment to responsible AI principles.