Google AI 2026 年 5 月：Gemini 3.5 和 Omni

谷歌借 5 月公告勾勒“智能体式”AI 战略

谷歌在 2026 年 5 月将一系列产品和研究公告整合到一个核心思路之下：AI 应从被动助手转变为更主动的系统，能够跨设备进行推理、创作并处理现实世界任务。在 6 月 5 日发布的一篇公司回顾中，谷歌表示，本月最重要的更新横跨 Google I/O 2026、Android Show 和 Google Health，而 Gemini 3.5 与 Gemini Omni 是这轮推进的核心。

这份综述传达的信息并不是谷歌推出了某一个孤立的模型或应用，而是公司正试图呈现一次协同的平台转型。按照谷歌的说法，5 月是“智能体式 Gemini 时代”正式开启的节点，新软件、硬件和健康产品都被视为 AI 更深入融入日常工作流程的例证。

Gemini 3.5 被定位为智能体基础设施

回顾中最突出的公告之一是 Gemini 3.5，谷歌将其描述为为智能体和编程提供“前沿智能”。这一表述很重要。谷歌并没有主要把该模型呈现为聊天机器人升级，而是将其塑造成一个旨在完成多步骤工作并支持软件开发场景的系统。

这种强调反映出 AI 公司在旗舰模型营销方式上的更广泛行业转向。原始基准表现依然重要，但厂商越来越多地在推销这样一种理念：他们的系统可以规划任务、进行推理，并在用户已在使用的产品中以更高自主性运行。谷歌的综述明确表明，它希望 Gemini 3.5 与这种转变联系在一起。

这份回顾没有提供技术基准或横向对比，因此这里的重要性更多是战略性的，而非经验性的。谷歌是在传递其认为下一层竞争焦点将是什么：智能体行为、编程辅助，以及在消费级和企业级界面之间更紧密的整合。

AI can now coach amateur virologists, and top tech leaders want Congress to act on DNA security

AI 领袖敦促国会强制 DNA 筛查

顶尖 AI 和科学界人士希望国会要求对合成 DNA 订单进行筛查，警告称 AI 正在降低危险生物知识的门槛。

Read article

Gemini Omni 扩展了多模态叙事

第二个重点是 Gemini Omni，谷歌称其将推理能力与创作能力结合在一起。公司表示，Omni 可以将图像、音频、视频和文本作为输入，并生成建立在 Gemini 现实世界知识基础上的高质量视频。

如果这一能力在实际使用中成立，那么它将标志着多模态 AI 系统演进中的重要一步。如今许多模型都能解读多种媒体形式，但谷歌明确将 Omni 作为一款能够从混合输入走向生成输出的工具来推介，起点是视频。这指向了一个更大的目标：不仅要以更多格式理解世界，还要在更丰富的上下文窗口中生成媒体。

谷歌的回顾还将 Omni 连接到一个更宏大的概念，即 AI 作为通用创意引擎。在这种框架下，这个模型不再局限于总结内容或回答问题，而是部分充当编辑系统、综合工具和制作软件。

从购物到健康，谷歌正在扩大 AI 的角色

谷歌 5 月的总结还强调了 AI 部署中更偏实用的一层。公司提到更新后的 Gemini 应用、用于购物的 Universal Cart，以及新的 Google Health 应用，作为 AI 变得更主动、更能融入日常生活的例子。

这表明重点出现了明显变化。公司不仅在抽象层面宣传模型能力，还将其与容易理解的消费任务联系起来。购物辅助、健康管理和日常规划，都是科技公司认为 AI 可以从偶尔使用变成习惯性使用的领域。

回顾中加入 Fitbit Air 也强化了这一点。谷歌正在把 AI 软件与个人健康硬件联系起来，暗示健康追踪和指导正成为其更广泛 AI 产品战略中更核心的一部分。

这个故事还有硬件层面。谷歌表示，Android Show 介绍了专门为这些工具打造的新设备，包括来自硬件合作伙伴的 Googlebook。换句话说，谷歌正在把 AI 呈现为不仅仅是可在任何地方运行的软件，也是一种能够塑造设备设计和产品类别的力量。

Google 给予出版商 AI 搜索退出选项，但仍保留主导权

在监管机构施压要求公司给予出版商对 AI 生成结果更多话语权之际，Google 正在 Search Console 中加入 AI 搜索控制与报告功能。

Read article

模拟与生命科学暗示了更宏大的研究议程

除了消费级产品外，这份综述还提到两个领域，暗示着更长远的研究议程。谷歌说，它推出了一种将 Project Genie 与 Street View 结合起来、用于模拟现实世界地点的体验。它还表示，已经启动一项将先进量子科学和 AI 应用于生命科学的计划。

这些提法虽然简短，却很有信息量。模拟真实地点可能对训练、规划或沉浸式数字工具有价值。生命科学计划则表明，谷歌希望把自己的 AI 叙事扩展到消费级生产力之外，并进入具有更高长期价值的科学应用。

这种表述在大型科技公司中并不陌生，它们常常借助健康和科学项目来说明其 AI 目标并不只是便利功能。就谷歌而言，这份回顾将这些努力与 Gemini 更新和新硬件放在了同一条发展脉络中。

一整月的公告，也是一场清晰的定位动作

由于这本身就是谷歌的综述，它读起来既像产品总结，也像一份优先级声明。公司希望用户、开发者和投资者把 2026 年 5 月视为一个高度集中的时点：其 AI 工作变得更连贯了，表现为更强的模型、更广泛的多模态生成、更主动的消费工具、与硬件更紧密的连接，以及在健康和科学领域更可见的角色。

目前仍未得到解答的是，这些产品在发布话术之外的实际表现如何，以及用户会多快采纳谷歌试图推动的行为变化。但战略方向已经很清楚。谷歌押注的是，AI 竞争的下一阶段将由那些不只是回应的系统取胜。它们需要协调任务、跨越不同格式、接入设备，并真正融入日常生活。

这正是谷歌在 5 月综述中试图阐明的观点。这个愿景能否持续，取决于的不是公告覆盖面的广度，而是公司能否把“智能体式”AI 从主题演讲口号变成可靠的日常体验。

本文基于 Google AI Blog 的报道。阅读原文。

Google Deepmind's Gemma 4 12B squeezes multimodal AI onto a laptop with just 16 GB of RAM

Gemma 4 12B 将多模态 AI 推向 16GB 笔记本电脑

Google DeepMind 的 Gemma 4 12B 将原生文本、图像和音频处理带到消费级笔记本电脑上，缩小了本地 AI 工作流与云端 AI 工作流之间的差距。

Read article

Originally published on blog.google

谷歌 5 月 AI 推进聚焦 Gemini 3.5 和 Omni

谷歌借 5 月公告勾勒“智能体式”AI 战略

Gemini 3.5 被定位为智能体基础设施

AI 领袖敦促国会强制 DNA 筛查

Gemini Omni 扩展了多模态叙事

从购物到健康，谷歌正在扩大 AI 的角色

Google 给予出版商 AI 搜索退出选项，但仍保留主导权

模拟与生命科学暗示了更宏大的研究议程

一整月的公告，也是一场清晰的定位动作

Gemma 4 12B 将多模态 AI 推向 16GB 笔记本电脑

Comments (0)

Related Articles

谷歌披露 Gemini 如何助力 I/O 2026 的制作

Keep Reading