Des attentes élevées, une confiance limitée

Une nouvelle enquête suédoise met en lumière un paradoxe au cœur de l’adoption de l’IA en médecine : les gens veulent que la technologie soit meilleure que les humains avant d’être pleinement prêts à lui faire confiance. Selon une étude de l’Université de Göteborg, les médecins comme les membres du public en Suède s’attendent à ce que les systèmes d’IA utilisés dans les soins de santé atteignent des niveaux de précision supérieurs aux performances humaines actuelles, en particulier dans les situations cliniques graves.

Ce résultat met en évidence une dure réalité pour les développeurs d’IA médicale et les systèmes de santé. Dans de nombreux secteurs, un nouveau logiciel peut être déployé dès lors qu’il est simplement utile, ou légèrement meilleur en matière de coût ou de rapidité. Dans les soins cliniques, le seuil social est différent. Les gens ne veulent pas seulement de l’efficacité. Ils veulent un système qui commette moins d’erreurs dangereuses que les professionnels qu’il est censé soutenir ou remplacer partiellement. Dans le même temps, l’enquête a révélé que la confiance dans l’IA reste modérée plutôt que forte, ce qui suggère que les attentes élevées progressent plus vite que la confiance.

L’étude reposait sur une enquête envoyée au printemps 2025 à 1 000 personnes sélectionnées au hasard en Suède, réparties également entre médecins et membres du grand public. Le taux de réponse était de 45 % chez les médecins et de 31 % dans le public. Les participants devaient évaluer différents scénarios de soins et indiquer quel niveau de cas manqués ou mal jugés serait acceptable de la part d’un système d’IA par rapport aux performances actuelles des soins de santé.

Pourquoi le niveau d’exigence augmente quand l’IA entre en scène

L’un des constats les plus nets est que les attentes s’intensifient dans les situations à forts enjeux. Dans des cas comme une douleur thoracique, de nombreux membres du public ne voulaient aucun cas manqué. Les médecins étaient davantage disposés à accepter une marge d’erreur étroite, ce qui reflète leur compréhension pratique du fait que le dépistage et le diagnostic impliquent toujours des arbitrages entre faux négatifs et faux positifs.

Cette différence compte, car elle met en lumière un problème récurrent dans les débats sur le déploiement de l’IA. La précision n’est pas un chiffre unique qui règle la question. Un système peut être calibré pour manquer moins de cas graves, mais cela peut aussi produire beaucoup plus de fausses alertes. Cela peut à son tour entraîner des examens inutiles, mobiliser le temps du personnel et exposer les patients à des procédures supplémentaires. Comme l’a noté le chercheur Rasmus Arvidsson dans le résumé de l’étude, un système qui qualifierait tout le monde de malade éviterait de manquer des maladies graves, mais ne constituerait pas une médecine utile.

Le défi n’est donc pas simplement de rendre l’IA plus sensible. Il s’agit de déterminer quel équilibre d’erreurs est acceptable, pour qui, et dans quel contexte. L’enquête suggère que le public et les cliniciens ne partent pas toujours de la même position. De nombreux citoyens semblent imposer à l’IA un idéal de quasi-absence d’erreur dans les situations graves, tandis que les médecins sont davantage habitués à évoluer dans l’incertitude clinique.

Ce décalage est susceptible d’influencer l’adoption. Si les patients attendent une quasi-perfection alors que les hôpitaux achètent des outils n’apportant que des gains marginaux, une réaction négative est prévisible. L’étude plaide donc pour un débat public plus explicite sur les compromis, plutôt que de présenter l’IA comme si elle pouvait les éliminer.

L’usage progresse plus vite que la confiance

L’enquête a également montré que de nombreux répondants utilisaient déjà l’IA sous une forme ou une autre, mais que relativement peu déclaraient lui accorder une forte confiance. Chez les médecins, la confiance dans les outils d’IA conversationnelle était à peu près équivalente à celle accordée aux systèmes d’IA déjà utilisés pour interpréter les ECG. Plus de sept médecins sur dix avaient essayé des outils de type chat, mais peu les utilisaient pour la prise de décision clinique.

Ce schéma est révélateur. L’expérimentation est répandue, mais le recours professionnel reste limité. Les cliniciens testent les outils, en voient le potentiel et les intègrent peut-être de manière informelle pour des tâches de fond ou la génération d’idées, mais ils ne les intègrent pas encore profondément dans les décisions qui engagent directement la responsabilité des résultats pour les patients.

Dans le grand public, environ un répondant sur dix a déclaré utiliser l’IA pour obtenir des conseils de santé. C’est notable, même si la confiance reste modérée. Cela suggère que l’IA destinée aux consommateurs s’insère déjà dans les comportements de santé quotidiens, bien avant qu’un large consensus institutionnel ne soit établi sur sa place dans les parcours de soins formels.

La combinaison d’une confiance modérée et d’un usage significatif crée un moment de transition. L’IA n’est plus hypothétique dans les soins de santé, mais elle n’est pas encore non plus normalisée comme une autorité clinique fiable. Pour les décideurs et les soignants, cette phase intermédiaire est peut-être la plus délicate. Les gens sont suffisamment exposés pour former des attentes, mais pas assez confiants pour accepter des erreurs qui seraient tolérées dans des systèmes humains.

Ce que l’étude montre, et ce qu’elle ne montre pas

  • Les médecins comme le public en Suède veulent que l’IA dans les soins de santé soit plus précise que les humains.
  • Les attentes sont particulièrement élevées dans les situations graves comme une douleur thoracique.
  • La confiance dans l’IA était modérée, peu de répondants déclarant une forte confiance.
  • Plus de sept médecins sur dix avaient essayé des outils d’IA conversationnelle, mais peu les utilisaient dans les décisions cliniques.
  • Environ un membre du public sur dix avait utilisé l’IA pour obtenir des conseils de santé.

Les auteurs signalent que le taux de réponse est conforme à celui d’études similaires, mais qu’il introduit aussi une incertitude quant à la représentativité des résultats pour l’ensemble de la population. Même ainsi, l’enquête capture une dynamique susceptible de dépasser les frontières de la Suède. L’IA médicale est évaluée selon un standard qui n’est pas seulement technique. Il est social, éthique et comparatif. Les gens se demandent si l’IA peut surpasser les soins existants, pas seulement si elle peut fonctionner.

Cette distinction définira probablement la prochaine phase de l’IA en santé. Les systèmes qui améliorent les flux de travail sans pouvoir justifier clairement leur profil d’erreur auront du mal à gagner la confiance. Les systèmes capables de démontrer des gains mesurables devront encore communiquer de manière transparente sur ce qu’ils manquent, ce qu’ils surestiment et la manière dont la responsabilité est partagée entre la machine et le clinicien. L’enquête suédoise suggère que la barre est déjà haute. Le constat plus difficile pour le secteur pourrait être que le public comme les médecins veulent encore relever cette barre avant d’être prêts à dépendre de l’IA en médecine.

Cet article s’appuie sur un reportage de Medical Xpress. Lire l’article original.

Originally published on medicalxpress.com