披着免费服务外衣的家庭数据收集

一家名为MicroAGI的初创公司通过其Shift应用,为纽约市居民提供免费家庭清洁服务,但真正的产品并不是清洁本身。该公司想要的是清洁工在私人住宅内工作的第一人称视频,并表示这些录像将帮助训练下一代家用机器人。

这种宣传方式异常直接。根据原文,Shift让纽约居民以录制第一人称清洁视频为交换,获得免费的专业家政清洁服务。客户在预约约两小时的服务前,需要提供电话号码、电子邮件地址、家庭住址以及进入说明等信息。

为什么这件事值得注意

AI公司经常谈到需要高质量的真实世界训练数据,尤其是在机器人领域。Shift之所以特别,是因为它把数据收集推进到最私密的环境之一,也就是家中。机器人训练通常依赖杂乱、变化多端、普通的人类空间样本,而佩戴摄像头的清洁工恰好能生成这类素材。

从技术上看,这个逻辑很清楚。家务之所以难以自动化,部分原因在于家庭环境并不一致。厨房布局各不相同,杂物每天都在变化,表面的光线反射也不一样,而有效清洁所需的动作顺序又取决于具体情境。展示人类完成这些任务的大型视频数据集,可能会成为具身AI系统有价值的训练材料。

从社会层面看,这种交换就没那么简单了。免费清洁听起来很诱人,但交换的不是金钱和劳动,而是私人的环境数据和劳动。这使得这项服务更像是一种数据采集业务,而不是普通的家庭服务平台。

MicroAGI提出的隐私说法

Shift的FAQ称,姓名、面孔以及其他个人信息会被自动匿名化,敏感细节会在视频被使用之前就被模糊处理。其隐私政策则表示,直接运行在智能眼镜或其他采集设备上的先进机器学习模型会先执行不可逆转换,例如自动人脸模糊和标识符混淆,然后才会把数据上传到云服务器。

这比许多消费级AI产品的隐私声明更周全,但并没有解决核心担忧。原文指出,该政策并未提到人们是否可以要求将自己的家庭清洁视频从训练数据集中移除。它也没有说明,匿名化是否足以阻止别人根据房屋布局、物品或其他上下文线索识别出具体住宅。

这并不是边缘情况。即使脸和名字被去掉,家庭仍然会暴露习惯、财物、家庭结构、日常作息和社会经济信号。模糊屏幕或身份证只能处理一种隐私风险,但并不能自动解决一个居住空间本身就是可识别数据这一更广泛的事实。

具身AI面临的更大问题

Shift也提醒人们,打造真正有用的家用机器人这场竞赛,可能在完全自主机器到来之前,就已经依赖于一些令人不适的劳动与同意安排。与其让机器人自己学习,公司或许首先需要让人类在适合机器学习的条件下生成海量数据集。从这个意义上说,这项服务属于AI领域的一个更大模式,即自动化往往从强化人类数据生产开始。

该公司网站写着“没有隐藏条件”,但显然是有的,那就是这些影像。人们是否会觉得这种交换可以接受,取决于他们对匿名化流程的信任程度,以及公司是否清楚解释未来的数据用途。目前来看,Shift的提议尖锐地展示了机器人技术的发展方向。家庭正在变成训练场,而隐私正在成为入场成本的一部分。

本文基于Ars Technica的报道。阅读原文

Originally published on arstechnica.com