Una importante expansión de los datos de salud del mundo real
El ecosistema de investigación de Estados Unidos sumó esta semana un nuevo y notable recurso de datos con la publicación del conjunto de datos de wearables del programa All of Us Research en Nature Medicine. Según el artículo, el conjunto de datos contiene información de Fitbit de más de 59.000 participantes a lo largo de 14 años, incluidas más de 39 millones de observaciones de pasos y 31 millones de observaciones de sueño. Casi la mitad de los participantes con datos de Fitbit también aportaron historiales clínicos electrónicos, mediciones físicas, genómica y datos de encuestas.
Esta combinación hace que el lanzamiento sea más que una gran colección de lecturas procedentes de dispositivos de consumo. Crea un conjunto de datos multimodal que puede vincular señales conductuales y fisiológicas cotidianas con resultados clínicos, contexto demográfico y datos moleculares. Para los investigadores que estudian biomarcadores digitales, sueño, ejercicio, riesgo de enfermedades crónicas y salud de la población, el alcance es significativo.
Por qué importa este conjunto de datos
Desde hace tiempo, los wearables se consideran una forma de llevar la investigación médica más allá de las instantáneas tomadas durante las visitas a la clínica. Los dispositivos pueden capturar información continua y del mundo real sobre movimiento, sueño y comportamiento a lo largo del tiempo. Pero muchos conjuntos de datos de wearables tienen una gran debilidad: a menudo están sesgados hacia poblaciones con más probabilidades de comprar y usar estos dispositivos, por lo general grupos más acomodados y menos diversos.
El artículo de All of Us aborda explícitamente ese problema. Los autores presentan este recurso como uno de los mayores conjuntos de datos de tecnología de salud digital, y de mayor riqueza demográfica, reunidos hasta la fecha. La misión del programa ha sido construir una cohorte de investigación que refleje mejor a las poblaciones históricamente infrarrepresentadas en la investigación biomédica. Si el componente de wearables tiene éxito en esos términos, podría ayudar a reducir una de las brechas más persistentes de la medicina digital: la desconexión entre quién genera los datos y quién se supone que debe beneficiarse de las conclusiones resultantes.
La escala más la vinculación es la ventaja clave
Los grandes números por sí solos no hacen que un conjunto de datos sea transformador. Lo que eleva este lanzamiento es la vinculación. El artículo señala que el 46% de los participantes con datos de Fitbit también aportaron historiales clínicos electrónicos, mediciones físicas, genómica y datos de encuestas. Eso significa que los investigadores pueden estudiar no solo si los patrones de actividad o sueño varían entre individuos, sino si esos patrones se relacionan con diagnósticos, historial de tratamiento, valores de laboratorio, experiencias reportadas e información genética.
En términos prácticos, eso abre varias líneas de investigación. Los científicos pueden examinar cómo las mediciones digitales se relacionan con el inicio, la progresión o la recuperación de enfermedades. Pueden comprobar si los patrones de comportamiento difieren entre grupos demográficos de formas que importan para la predicción del riesgo. También pueden evaluar si las señales derivadas de wearables funcionan de manera consistente entre poblaciones, algo esencial si los biomarcadores digitales van a respaldar la salud de precisión en lugar de profundizar las desigualdades existentes.
El artículo describe el conjunto de datos como un recurso que permite investigar relaciones entre métricas de salud digital y resultados clínicos, al tiempo que impulsa la metodología de salud digital mediante el tamaño, la representación y la vinculación multimodal. Es una forma cuidadosa de decir que el recurso es útil tanto para estudiar enfermedades como para poner a prueba los métodos que sustentan la salud digital en sí misma.
Qué pueden aprender los investigadores de los datos continuos
Los conteos de pasos y los registros de sueño pueden parecer simples, pero cuando se capturan a gran escala durante largos periodos pueden volverse analíticamente poderosos. Los patrones de actividad pueden asociarse con riesgo cardiovascular, enfermedad metabólica, trayectorias de recuperación, envejecimiento y salud mental. Los datos de sueño pueden informar estudios sobre alteraciones circadianas, carga de enfermedad crónica y vínculos entre los patrones de descanso y los resultados médicos posteriores.
Como el conjunto de datos abarca años, también puede ayudar a los investigadores a estudiar el cambio y no solo el estado. Los datos longitudinales pueden revelar si el descenso de la actividad precede a un diagnóstico, si la alteración del sueño acompaña al tratamiento o si los efectos de una intervención aparecen en la vida cotidiana antes de reflejarse en los criterios de valoración tradicionales. Ese tipo de detalle temporal es una de las razones por las que los datos de salud digital han atraído tanta atención.
Aun así, la contribución del artículo no es una afirmación clínica de que una métrica prediga una enfermedad específica. Es la publicación de una infraestructura: un conjunto de datos lo bastante grande y variado como para permitir que muchos grupos pongan a prueba esas preguntas con rigor.
El desafío de la inclusión en la salud digital
Los autores señalan que la investigación en salud digital ha estado a menudo limitada por sesgos demográficos. Ese desafío tiene implicaciones mucho más allá de la equidad. Si los datos de wearables proceden de forma desproporcionada de poblaciones reducidas, los modelos construidos a partir de ellos pueden generalizar mal. Un biomarcador digital que parece sólido en un grupo puede rendir por debajo de lo esperado en otro. Una herramienta de predicción puede parecer precisa mientras incorpora puntos ciegos ocultos.
Al ampliar el alcance demográfico de la recolección de datos basada en dispositivos, All of Us intenta cambiar ese punto de partida. El conjunto de datos no eliminará por sí solo el sesgo en la práctica de investigación ni en el desarrollo de modelos. Pero puede hacer más difícil ignorar la representación como un problema metodológico. En ese sentido, el lanzamiento es importante tanto científica como institucionalmente: obliga más a los investigadores a examinar para quién funcionan sus modelos.
Qué sigue
El verdadero impacto del conjunto de datos dependerá de cómo se use. Los artículos de recursos suelen marcar el comienzo más que el final de una historia. La siguiente fase estará determinada por los estudios que recurran a estos registros y por la forma en que los investigadores aborden cuestiones como la falta de datos, la variación entre dispositivos, la confusión conductual y los límites de las mediciones de consumo.
Aun así, la publicación señala una etapa de madurez para la investigación en salud digital. En lugar de depender principalmente de pequeños conjuntos de datos propietarios o de cohortes reclutadas de forma estrecha, los científicos tienen cada vez más acceso a fuentes de datos del mundo real amplias, vinculadas y más representativas. Eso cambia qué tipo de preguntas pueden formularse con credibilidad.
Para la agenda más amplia de salud de precisión, ese es el punto. Los wearables suelen comercializarse como herramientas personales de bienestar, pero su mayor valor científico reside en lo que pueden revelar a escala poblacional a lo largo del tiempo cuando se combinan con un contexto clínico sólido. El lanzamiento de All of Us acerca esa posibilidad al uso rutinario en investigación.
Un recurso fundacional más que un resultado de titular
No hay un único hallazgo médico de gran impacto asociado a este artículo, y precisamente por eso importa. Los conjuntos de datos fundacionales rara vez producen los titulares más dramáticos de inmediato, pero a menudo moldean la siguiente ola de descubrimientos. Al documentar un gran conjunto de datos de wearables con amplio alcance demográfico y una vinculación sustancial con otros datos de salud, el programa All of Us Research ha creado un recurso que podría influir durante años en la medicina digital, la epidemiología y la salud de precisión.
Su valor se medirá en última instancia no por el número de registros de dispositivos, sino por si esos registros ayudan a producir una ciencia mejor y más inclusiva. Este lanzamiento ofrece a los investigadores la materia prima para intentarlo.
Este artículo se basa en la cobertura de Nature Medicine. Leer el artículo original.
Originally published on nature.com







