更强的模型表现更好,而用户并未察觉
Anthropic的一项内部实验表明,一种微妙但重要的AI不平等可能已经开始出现:由更强模型代理的人,能够在无人察觉差距存在的情况下获得更好的结果。根据所提供的原文,Anthropic在2025年12月进行了一项为期一周的内部市场实验,名为“Project Deal”,共有69名员工通过基于Claude的AI代理在Slack上买卖真实商品。
每位参与者获得100美元预算。在市场开放之前,Claude会采访志愿者,了解他们想买或想卖什么、价格偏好以及希望代理采用怎样的谈判风格。Anthropic随后根据这些输入生成定制系统提示词。之后,AI代理全程处理流程:撰写商品信息、寻找交易对象、提出报价、讨价还价并完成交易。人类只在最后一步重新介入,交换实物。
这项实验的关键设计是对参与者隐藏的。Anthropic并行运行了多个市场版本。在一些版本中,每位参与者都由Claude Opus 4.5代表,原文将其描述为当时Anthropic的前沿模型。在另一些版本中,参与者有50%的概率由Claude Haiku 4.5代表,这是公司最小的模型。
结果不只是技术性的,更是社会性的
根据原文,能力更强的Opus模型平均而言持续获得更好的价格并达成更多交易,而Haiku则表现较弱。与此同时,更激进的谈判指令并未带来统计上显著的结果差异。换句话说,模型能力比单纯告诉系统“更强硬地讨价还价”更重要。
这与企业采用AI时的一个常见直觉相悖,即组织有时会认为,提示词风格或表面行为决定了大部分价值。Anthropic的发现表明,底层模型能力可能比语气更重要。如果这一模式具有普遍性,那么智能体本身的质量可能会悄无声息地决定谁在数字交易中获得有利条件。
最引人注目的发现或许不是经济层面,而是感知层面。Anthropic称,由较弱的Haiku智能体获得客观上更差结果的用户,仍将自己的交易评价为与由Opus代表的用户一样公平。正是这种错位,被公司视为AI辅助决策中的一种“隐形不平等”。
这是一个影响深远的想法。传统形式的不平等通常体现在定价、可及性或服务质量上。Anthropic指出的则更难察觉:两个人可以同样满意,但其中一人实际上一直由机器给予了更差的代表。
AI智能体正在成为中介
Project Deal之所以重要,是因为它把讨论从聊天机器人推进到代理能力。这里的系统不只是回答问题,而是在与其他机器的谈判中代表人类。这使它们更像市场中的中介,而不仅仅是生产力工具。
随着这一角色扩展,模型差异可能对商业、采购、招聘、客户服务和内部业务运营产生直接后果。如果更强的系统总能更好地谈判、更有效地整理信息或找到更优的交易对象,那么获得前沿模型就成了一种现实优势。处在这一差距另一侧的人,甚至可能都不知道自己处于劣势。
原文并未声称这一结果会自动延伸到所有市场。该实验是内部的、持续时间短、规模有限。即便如此,它仍然提供了一个具体示例,说明政策制定者和企业很可能越来越常面对的现实:一旦AI智能体开始替用户行动,能力差距就可能转化为结果差距。
仅靠提示词可能不够
报道中一个很有用的发现是,更激进的谈判指令并未带来统计上显著的改进。这说明组织不能想当然地认为,只要把提示词调得更强硬,就能弥补较弱模型的不足。
对于AI系统的开发者和采购方来说,这是一个实际警告。智能体性能可能更多取决于核心推理和决策质量,而不是人格包装。一个华丽的界面或强硬的语气,并不一定意味着更强的代表能力。
这个区别很重要,因为许多AI部署之所以被接受,是因为它们“足够用”,而不是“足够好”。如果一个更便宜或更小的模型在对话中看起来还不错,那么当它被赋予代表用户做决定或谈判的责任时,表现可能仍会明显更差。
政策问题已经到来
Anthropic关于“隐形不平等”的表述,显然不只适用于这一个实验。如果组织在不同员工层级、客户群体或公共服务中部署不同等级的AI智能体,就可能在使用者看不出不公平的情况下制造不均等对待。
这比简单透明更难治理。告诉用户某个AI参与了决策,并不能回答这个AI是否和别人用的那个一样强大。而当用户体验依然感觉公平时,市场或机构可能不会立即受到纠正不平衡的压力。
因此,Project Deal更像一个早期警报。它表明,AI访问权不仅关乎一个人是否拥有数字助手,还关乎他得到的是哪一种助手,以及当结果有实际利害关系时,这个助手有多强。
- Anthropic在Slack里用Claude智能体做了一个为期一周的内部市场,处理真实交易。
- Claude Opus 4.5平均获得了比Claude Haiku 4.5更好的价格和更多交易。
- 由较弱智能体代表的用户没有察觉到这种劣势,却仍然给出相似的公平性评价。
本文基于 The Decoder 的报道。阅读原文。
Originally published on the-decoder.com

