演示之后的问题
人工智能最重要的问题,或许已经不再是系统是否令人印象深刻,而是它们在离开演示、编程基准测试和投资人材料之后,能否产生可靠的经济价值。这正是 MIT Technology Review 一篇新分析所提出的观点。该分析把当前的 AI 时刻描绘成一个熟悉的三步幻想:先把技术造出来,再假定利润会随之而来,而中间最困难的部分则被省略。
所提供的原文引用了《南方公园》里的一个著名笑话:“第一阶段:收集内裤。第二阶段:?第三阶段:利润。” 在这次改写中,AI 已经通过产出强大的系统完成了第一阶段,整个行业也在高声承诺第三阶段,也就是变革和经济收益。尚未解决的是第二阶段:把能力转化为日常工作价值的繁琐过程。
这种表述之所以成立,是因为它抓住了当前 AI 热潮核心的矛盾。模型可以写作、总结、分类、生成代码,并处理越来越多依赖语言的任务。然而,在基准测试或试点项目中表现出色,并不等于在真实组织内部就会自动转化为生产力、利润率提升或持久的投资回报。
文章指出,即便是最优秀的 AI 系统,在编程之外的场景里,仍然难以在工作场所实现经济可行性。这个区别很重要。编程已经成为生成式 AI 最早、也是最强的商业落点之一,因为输出是数字化的,工作流是迭代式的,用户通常也很擅长评估结果。许多其他领域就没有这么宽容。错误成本更高,监督更慢,任务结构更松散,与现有流程的集成也更困难。
这篇分析把两项近期研究作为这种差距的例子。其中一项来自 Anthropic,预测了哪些类型的工作可能最受大语言模型影响,突出管理者、建筑师和媒体从业者等角色,同时暗示园林工、建筑工人和酒店业员工受到的影响较小。但文章强调,这类预测本质上仍只是对任务匹配度的猜测,并不能证明它们在真实工作场景中的实际表现。
这一区别至关重要。一个模型在理论上看起来能够协助完成某项任务,但仍可能在决定雇主是否会大规模部署它的实际门槛面前失败。这些门槛包括可靠性、合规性、监控成本、用户信任、工作流重构,以及一个很简单的问题:使用该系统到底是否比沿用现有方法更快或更便宜。
同样的问题也笼罩着许多关于 AI 的宏大主张。企业高管和研究人员可以把这项技术描述为具有经济变革性,而他们也许最终是对的。但只有当组织能够在生产环境中反复捕捉到这种价值时,变革才算数。这意味着,真正的竞争也许不在于谁拥有最先进的模型,而在于谁能够定义、落地并规模化模型输出与商业结果之间缺失的中间层。
这一层可能包括流程重构、监管、监督机制、软件界面、定价模式、培训,以及更清晰地理解 AI 在哪里真正增强人类工作,而不是让工作更复杂。MIT Technology Review 的文章指出,不同阵营已经在这个中间空间中投射出不同答案。与 Pause AI 相关的行动者认为监管至关重要。推动者则常常略过不确定性,因为他们更关注终点,而不是路径。
现实中,路径才是故事。每一轮重大的职场技术浪潮都依赖于围绕工具本身的配套系统。电子表格很重要,但吸收它的业务流程也同样重要。互联网很重要,但支付、物流、标准和用户习惯也同样重要。AI 很可能会遵循同样的模式。模型只是价值链的一部分。
这也是当前市场充满张力的原因。企业已经在模型、算力、集成和试点上投入巨大。他们承受着压力,需要证明这些支出带来的不只是新奇感。如果经济回报只在少数应用中依然最强,那么从炒作走向广泛盈利的路径就会比许多预测所暗示的更慢,也更挑选性。
因此,缺失的步骤并不是一个小小的实施细节,而是 AI 时代最核心的商业问题。只有当公司能够拿出证据,解释自己如何从技术可能性走向可重复的职场收益时,这个行业才不会在真正突破与过高期待之间反复摇摆。AI 已经到了这样一个阶段:它最艰难的挑战不再是继续增加能力,而是让能力真正产生价值。
本文依据 MIT Technology Review 的报道改写。阅读原文。
Originally published on technologyreview.com
