Una captura de datos domésticos disfrazada de servicio gratuito

Una startup llamada MicroAGI está ofreciendo limpieza gratuita del hogar a residentes de Nueva York a través de su aplicación Shift, pero el verdadero producto no es la limpieza en sí. La empresa quiere video en primera persona de limpiadores trabajando dentro de casas privadas, y dice que esas grabaciones ayudarán a entrenar a la próxima generación de robots domésticos.

La propuesta es inusualmente directa. Según el texto original, Shift conecta a neoyorquinos con limpiadores profesionales gratuitos a cambio de grabar imágenes de limpieza en primera persona. Se pide a los clientes que proporcionen información como número de teléfono, correo electrónico, dirección del hogar e instrucciones de acceso antes de reservar una cita estimada en unas dos horas.

Por qué destaca esto

Las empresas de IA hablan constantemente de la necesidad de datos de entrenamiento del mundo real de alta calidad, especialmente en robótica. Lo que hace notable a Shift es que lleva la recolección de datos a uno de los entornos más íntimos posibles: el hogar. El entrenamiento de robots a menudo depende de ejemplos de espacios humanos desordenados, variables y ordinarios, y un limpiador con cámara puede generar exactamente ese tipo de material.

Desde el punto de vista técnico, la lógica es clara. Las tareas domésticas son difíciles de automatizar en parte porque los hogares no son consistentes. Los diseños de las cocinas cambian, el desorden varía día a día, las superficies reflejan la luz de forma distinta y la secuencia de acciones necesarias para limpiar bien depende del contexto. Un gran conjunto de videos que muestre a humanos haciendo esas tareas podría ser material de entrenamiento valioso para sistemas de IA encarnada.

Desde el punto de vista social, la oferta es mucho menos sencilla. La limpieza gratis suena atractiva, pero el intercambio no es dinero por trabajo. Es datos ambientales privados por trabajo. Eso acerca el servicio más a una operación de adquisición de datos que a un mercado doméstico normal.

El argumento de privacidad que hace MicroAGI

La FAQ de Shift dice que los nombres, rostros y otra información personal se anonimizan automáticamente, y que los detalles sensibles se difuminan antes de que el material se use siquiera. Su política de privacidad afirma que modelos avanzados de machine learning que se ejecutan directamente en gafas inteligentes u otros dispositivos de captura realizan transformaciones irreversibles, como difuminado automático de rostros y ofuscación de identificadores, antes de que cualquier dato se cargue en servidores en la nube.

Esa es una afirmación de privacidad más cuidadosa que la de muchos productos de IA de consumo, pero no resuelve la principal preocupación. El texto original señala que la política no menciona si las personas pueden solicitar que se eliminen sus videos de limpieza del hogar de los conjuntos de datos de entrenamiento. También deja abierta la pregunta de si la anonimización basta para evitar que las viviendas se reconozcan por su distribución, objetos u otras pistas contextuales.

Esos no son casos extremos. Un hogar puede revelar hábitos, pertenencias, composición familiar, rutinas y señales socioeconómicas incluso cuando se eliminan los rostros y los nombres. Difuminar una pantalla o una identificación aborda una clase de riesgo de privacidad. No resuelve automáticamente el hecho más amplio de que un espacio habitado es, en sí mismo, un dato identificable.

El problema mayor en la IA encarnada

Shift también recuerda que la carrera por construir robots domésticos útiles puede depender de acuerdos incómodos de trabajo y consentimiento mucho antes de que lleguen las máquinas totalmente autónomas. En lugar de que los robots aprendan por sí solos, las empresas quizá primero necesiten que los humanos generen enormes conjuntos de datos en condiciones optimizadas para el machine learning. En ese sentido, el servicio forma parte de un patrón mayor en la IA en el que la automatización suele comenzar con una producción intensificada de datos humanos.

El sitio web de la empresa dice que “no hay trampa”, pero claramente la hay: el material grabado. Que ese intercambio parezca aceptable dependerá de cuánta confianza haya en el proceso de anonimización y de cuán claramente explique la empresa el uso futuro de los datos. Por ahora, la oferta de Shift es una ilustración contundente de hacia dónde va la robótica. El hogar se está convirtiendo en campo de entrenamiento, y la privacidad en parte del precio de entrada.

Este artículo se basa en cobertura de Ars Technica. Leer el artículo original.

Originally published on arstechnica.com