الذكاء الاصطناعي الطبي ينتشر أسرع من الأدلة التي تدعمه
تطرح افتتاحية نُشرت في Nature Medicine حجة مباشرة بشأن إحدى أكبر الثغرات في تكنولوجيا الرعاية الصحية: الصناعة أصبحت أفضل بكثير في بناء أدوات الذكاء الاصطناعي، لكنها لا تزال تفتقر إلى أدلة متسقة على أن هذه الأدوات تحسن الرعاية في الممارسة الفعلية. النماذج التنبؤية، وأنظمة دعم القرار، والأدوات التوليدية تدخل بالفعل إلى البيئات السريرية، كما أن النماذج اللغوية الكبيرة تُستخدم من قبل الجمهور للحصول على معلومات صحية. وتقول الافتتاحية إن التبني يتسارع عبر قطاع الرعاية الصحية، لكن إثبات القيمة في العالم الواقعي لا يزال محدودًا.
هذا التمييز هو جوهر المقال. يمكن أن يبدو الذكاء الاصطناعي الطبي مثيرًا للإعجاب على الورق، لا سيما عندما يعلن المطورون عن مقاييس إحصائية مثل الحساسية، والنوعية، والتمييز، والمعايرة. هذه الأرقام تصف أداء النظام على المستوى الحاسوبي. لكنها لا تثبت تلقائيًا أن المرضى يتلقون علاجًا أفضل، أو أن الأطباء يتخذون قرارات أفضل، أو أن أنظمة الصحة تعمل بكفاءة أعلى بعد النشر.
لماذا لا تكفي مقاييس الأداء
تجادل الافتتاحية بأن الرعاية الصحية انحرفت نحو فهم ضيق جدًا لما يعنيه التحقق. قد يحقق النموذج نتائج جيدة في الاختبارات الاستعادية، ومع ذلك يفشل سريريًا إذا وصل في التوقيت الخاطئ، أو كان من الصعب تفسيره، أو تجاهله الموظفون، أو عطّل سير العمل القائم. بعبارة أخرى، النجاح التقني ليس هو نفسه الفائدة الطبية.
وهذا ليس اعتراضًا أكاديميًا صغيرًا. فإذا اعتمدت المستشفيات أو مقدمو الخدمة على مقاييس الأداء بشكل أساسي عند تبني الأدوات، فقد ينفقون الوقت والمال على منتجات غير واضحة القيمة العملية. والأسوأ من ذلك أنهم قد يضيفون أضرارًا أو أوجه قصور جديدة لا تظهر في دراسات المقارنة المرجعية. وتحذر الافتتاحية من أن عادات المجال الحالية تنطوي على خطر التنفيذ المبكر، جزئيًا لأن الادعاءات حول التأثير أصبحت أكثر شيوعًا في الأوراق والمواد التسويقية حتى عندما تظل معايير الأدلة غير واضحة.
لطالما طلب الطب سلسلة أقوى من الأدلة عندما تكون الفائدة السريرية الحقيقية على المحك. وتطوير الأدوية مثال واضح. فالدواء الجديد لا يُحكم عليه فقط لأنه يُحدث أثرًا كيميائيًا حيويًا أو يبدو واعدًا في العمل المخبري المبكر. بل يمر عبر متطلبات أدلة مرحلية، ويساعد الإشراف العام في تحديد متى تكون الأدلة كافية للموافقة أو التوصية أو السداد.
وتقول الافتتاحية إن الذكاء الاصطناعي الطبي لم يطوّر معايير مماثلة. وهذا لا يعني أن البرمجيات يجب أن تُنظم تمامًا مثل الدواء. فالتقنيات تتطور بسرعة، والتطبيقات تختلف كثيرًا، والحوافز لتوليد الأدلة غير متكافئة. لكن إذا أرادت الشركات والمؤسسات الادعاء بأن الذكاء الاصطناعي يحسن الرعاية، فإن المجال يحتاج إلى إطار يربط تلك الادعاءات بأدلة تتناسب مع حجم الأثر المزعوم.

