Une expansion majeure des données de santé du monde réel

L’écosystème de recherche américain a gagné cette semaine une nouvelle ressource de données notable avec la publication, dans Nature Medicine, du jeu de données issues de wearables du programme All of Us Research. Selon l’article, l’ensemble de données contient des données Fitbit provenant de plus de 59 000 participants sur 14 ans, dont plus de 39 millions d’observations de pas et 31 millions d’observations de sommeil. Près de la moitié des participants disposant de données Fitbit ont également fourni des dossiers de santé électroniques, des mesures physiques, des données génomiques et des données d’enquête.

Cette combinaison fait de cette publication bien plus qu’une vaste collection de relevés issus d’appareils grand public. Elle crée un jeu de données multimodal susceptible de relier des signaux comportementaux et physiologiques quotidiens à des résultats cliniques, à un contexte démographique et à des données moléculaires. Pour les chercheurs qui étudient les biomarqueurs numériques, le sommeil, l’exercice, le risque de maladies chroniques et la santé des populations, l’ampleur est considérable.

Pourquoi ce jeu de données est important

Les wearables sont depuis longtemps perçus comme un moyen de faire sortir la recherche médicale des instantanés pris lors des visites en clinique. Ces appareils peuvent capturer des informations continues, en conditions réelles, sur le mouvement, le sommeil et les comportements au fil du temps. Mais de nombreux jeux de données issus de wearables présentent une faiblesse majeure : ils sont souvent biaisés en faveur des populations les plus susceptibles d’acheter et d’utiliser ces appareils, généralement des groupes plus aisés et moins diversifiés.

L’article d’All of Us traite explicitement ce problème. Les auteurs présentent cette ressource comme l’un des plus vastes jeux de données de technologie de santé numérique, et parmi les plus riches sur le plan démographique, jamais constitués à ce jour. La mission du programme est de bâtir une cohorte de recherche qui reflète mieux les populations historiquement sous-représentées dans la recherche biomédicale. Si le volet wearables réussit à cet égard, il pourrait contribuer à réduire l’un des écarts les plus persistants de la médecine numérique : le décalage entre celles et ceux qui génèrent les données et celles et ceux qui sont censés bénéficier des connaissances qui en résultent.