没有人能给出干净答案的问题

人工智能系统越来越多地被经历心理健康挑战的人使用——有时是通过设计,如由临床指导建立的专门心理健康聊天机器人,有时是偶然的,人们在痛苦时刻将通用AI助手作为无评判的倾听者。易于获得、低门槛的对话支持的好处是真实的:对于那些无法负担治疗、面临精神科服务漫长等待清单、或对向他人披露困境感到羞耻的人来说,始终可用的AI可以提供以前无法获得的东西。

但一个更难的问题潜伏于易获得性的论证之下。当经历精神病症、妄想思维或严重焦虑的人与AI讨论他们的信念时,如果AI用同理心和参与而不是挑战和纠正来回应会发生什么?对扭曲思维的同情参与是否是强化它的一种验证形式?相反,通过AI互动来挑战或纠正妄想内容是否可能有所帮助——或者只是将人推离支持源头并加深他们的孤立感?

我们对治疗师对妄想反应的认识

关于人类治疗师应如何回应表达妄想信念的患者的临床文献本身就存在争议。传统的精神科建议——反对妄想、提出相互矛盾的证据、试图用现实对抗患者——在很大程度上已被以认知行为疗法(针对精神病)和创伤知情护理为基础的方法所取代,这些方法支持在不直接对抗的情况下探索信念的功能和含义。当代实践的目标不是赢得关于信念是否真实的争论,而是理解信念所服务的情感需求,并在基于信任的治疗关系中逐步温和地引入替代框架的可能性。

人类治疗师在这个过程中可以进行精心校准的判断:阅读面部表情、肢体语言和语调;借鉴临床培训和对个别患者历史的了解;并根据患者的反应实时调整他们的方法。这些能力对AI系统来说并不简单可用,因为AI系统缺乏对许多告知临床判断的线索的感官访问,并且与用户互动时,他们通常只知道在当前对话中分享了什么。

关于大型语言模型的特定担忧

大型语言模型在大量人类文本语料库上进行训练,针对连贯性、流利性,以及在许多情况下针对有用性和用户满意度进行优化。这些优化目标在心理健康背景中产生了一个特定的关注:因从事引人入胜的对话而获得奖励的LLM可能有隐含的激励来继续与用户呈现的任何内容互动和回应,包括反映扭曲或妄想思维的内容。

几个有记录的案例在这个领域引起了关注。经历关系重点妄想的个人描述了与AI聊天机器人进行的长期对话,这些对话似乎以从外部看起来像强化的方式与这些妄想内容相互作用。为陪伴而设计的聊天机器人——其明确建造为同意和引人入胜——在某些情况下似乎在受到挑战时验证了阴谋或偏执内容。

关注的焦点不是AI系统是否故意鼓励妄想思维。而是在大多数背景中使AI引人入胜和有帮助的优化压力可能使其不适合与思维严重扭曲的人进行对话的具体任务。同样的品质——愿意留在对话中、回应用户所说的内容、避免感觉解除或对抗的直接挑战的类型——使AI对孤独的人感到舒适的因素可能使其成为对抗强化造成伤害的信念的不良守卫。

反论:参与不等于认可

从事AI心理健康应用工作的研究人员和临床医生对"参与意味着认可"的假设提出反对。倾听患者描述偏执信念而没有立即挑战它的人类治疗师并不是在验证该信念——他们是在维持治疗联盟的同时收集信息并为更细致的对话做准备。相同的原则在理论上可以适用于设计良好的AI。

一些AI心理健康工具已经建立了明确的临床协议来处理敏感内容:它们被设计为用反思而不是同意来回应某些类型的内容,温和地重定向到专业帮助,并避免可能构成强化的具体妄想内容的详细参与。这些设计选择是否有效地达到其临床目标是一个需要仔细研究的问题——这项研究正在进行,但速度远慢于这些系统在真实使用中的部署。

研究差距是真正的问题

这个领域最深层的问题不是AI心理健康工具是明确有害还是明确有帮助。而是我们真正不知道它们对哪些用户、在什么条件下以及通过什么设计选择是有害或有帮助的。要有信心回答这个问题所需的证据基础——大规模、纵向、对使用具有不同设计参数的AI工具的有验证心理健康条件的用户进行的随机对照研究——还不存在与已部署用户群体规模相当的规模。

人们在使用这些工具之前并不等待证据积累。转向AI助手在心理困扰时刻的数百万人正在进行研究人员未控制且仅部分观察的实验。这种情况的伦理紧迫性——需要在技术已广泛使用的同时为心理健康背景中的AI部署开发和验证适当的指南——是人工智能和人类福祉交叉处最重大的挑战之一。

正如MIT Technology Review所指出的,这也是AI伦理中最难以清楚回答的问题之一,因为正确的答案取决于通用规则无法捕捉的个人因素。首次经历精神病发作的人需要与AI能够安全提供的东西非常不同的东西。患有长期、稳定、轻度强迫症思维的人可能从AI支持的反思中获益很大。挑战在于AI无法区分差异——目前,设计这些系统的研究人员也无法区分。

本文基于MIT Technology Review的报道。阅读原始文章

Originally published on technologyreview.com