中国最受关注的 AI 名称之一带来的备受瞩目回归

DeepSeek 预览版 V4 的发布,标志着该公司自 R1 推理系统在 2025 年初重塑全球关于高效前沿 AI 的讨论以来,最具分量的一次模型推出。据 MIT Technology Review 报道,这款新的旗舰模型通过一种旨在更高效处理大规模文本的设计,能够处理比上一代长得多的提示词。更重要的是,它仍然是开源的,延续了该公司让先进模型权重广泛可用、而不是将其封装在完全专有服务背后的策略。

这一组合之所以重要,是因为它瞄准了当前 AI 市场中的两大核心约束:成本与控制。随着开发者构建需要吸收大量文档、长对话或多步骤指令的编程工具、智能体系统和企业工作流,更长上下文处理能力正变得越来越关键。与此同时,开放访问让企业能够在不完全依赖少数几家美国模型提供商、也不必接受不断上升的使用成本的情况下采用先进能力。

为什么 V4 依然重要,即便它不会像 R1 那样震动市场

MIT Technology Review 明确指出,V4 不太可能像 R1 那样重新搅动整个领域。但这并不意味着这次发布只是渐进式更新。DeepSeek 现在正试图证明,先前的突破并非只是在有利时机出现的一次偶发事件。第二次重大发布有助于确立该公司作为持续前沿参与者的地位,而不只是一次意外的象征。

这次发布还出现在一段艰难时期之后。原文提到,过去几个月里该公司经历了严格审视、重要人员离职、早期版本发布延迟,以及来自美国和中国监管机构日益增加的关注。在这一背景下,V4 既是一次技术更新,也是一次组织韧性的表态。DeepSeek 不仅带着新模型回归,而且仍然坚持最初让它如此具有影响力的开源模型路线。

两个版本,一套策略

该公司将以两种形式发布 V4:V4-Pro 面向编程和复杂智能体任务,V4-Flash 则旨在运行更快、成本更低。两个版本都提供推理模式,展示模型在处理提示词时的逐步思考过程。这种分化反映了更广泛的市场趋势。开发者越来越需要一组模型,而不是单一旗舰:一个针对更难、价值更高的任务进行优化,另一个则针对更低延迟和对成本更敏感的场景进行优化。

MIT Technology Review 对 DeepSeek 定价说法的总结延续了该公司更广泛的信息:高端性能不一定要伴随高端供应商式的经济成本。独立基准最终是否能全面验证这些说法,是另一个问题。眼下更重要的是,DeepSeek 再次在可负担性而不仅仅是能力上设定预期。这继续给专有实验室和其他开放权重开发者施加压力。