السؤال الأساسي لم يعد ما إذا كان الذكاء الاصطناعي الطبي يعمل من حيث المبدأ

لقد تجاوز الذكاء الاصطناعي في الرعاية الصحية مرحلة الجدة. تستخدم المستشفيات الذكاء الاصطناعي في تدوين الملاحظات، ومراجعة السجلات، ودعم الفرز، وتفسير الصور، وتقديم توصيات مرتبطة بالعلاج. وتوضح مادة MIT Technology Review المقدمة أن المجال يواجه الآن مشكلة مختلفة: الأدلة على الأداء التقني تصل أسرع من الأدلة على الفائدة السريرية في العالم الحقيقي.

هذا التمييز سهل الطمس. قد يكون النموذج دقيقا في التعرف على الأنماط، أو تصنيف الصور، أو تلخيص المحادثات. لكن تحسن المخرجات في هذه المهام لا يعني تلقائيا صحة أفضل للمريض. يمكن للأداة أن توفر وقت الأطباء، أو تنتج وثائق أنظف، أو تقدم توصيات تبدو معقولة، ومع ذلك لا تحسن التشخيص أو العلاج أو النتائج.

صعود الذكاء الاصطناعي المحيط يجسد الفجوة

أحد أوضح الأمثلة هو انتشار ما يسمى بكتبة الذكاء الاصطناعي المحيط. تستمع هذه الأنظمة إلى محادثات الطبيب والمريض، وتقوم بتفريغها نصيا، وتنتج ملخصات. وتذكر المصدر أنها تُعتمد بالفعل على نطاق واسع وأن الأطباء غالبا ما يبدون رضا عاليا عنها. كما تشير دراسات مبكرة إلى أنها قد تقلل الاحتراق الوظيفي.

هذه مكاسب مهمة. فالعبء الإداري الزائد مصدر حقيقي للإجهاد في الطب. وإذا أزال الذكاء الاصطناعي جزءا من هذا العبء، فقد يحسن بيئة العمل للأطباء. لكن الباحثتين المذكورتين في المصدر، جينا وينز وآنا غولدنبرغ، تجادلان بأن هذا لا يزال يترك السؤال الأساسي مفتوحا: ماذا يحدث للمرضى؟ إذا غيّرت كاتبة الذكاء الاصطناعي بشكل طفيف ما يتم تسجيله أو التأكيد عليه أو حذفه، فقد تؤثر في القرارات اللاحقة بطرق لا تظهر بوضوح من استطلاعات الرضا.

الدقة ليست هي نفسها الأثر

ويمتد الأمر نفسه إلى أنظمة التنبؤ والتوصية. تستخدم المستشفيات بشكل متزايد نماذج لتحديد المرضى الذين قد يحتاجون إلى تدخل، أو المسار الذي قد يسلكه المرض، أو الإجراء الذي ينبغي على الطبيب النظر فيه لاحقا. وغالبا ما تُطرح هذه الأنظمة بوعد تحقيق كفاءة واتساق أكبر. لكن ما لم تُقيّم مقابل نتائج المرضى، فإن المجال يواجه خطر الخلط بين سهولة التشغيل والتقدم الطبي.

قد يحدد النموذج المرضى المناسبين، لكنه يصل متأخرا جدا بحيث لا يعود لذلك أثر. وقد يقدم توصية صحيحة يتجاهلها الأطباء. وقد يغير انتباه الموظفين بطرق تفيد مجموعة بينما تترك أخرى خلفها. هذه ليست حالات هامشية؛ إنها وقائع عملية لنشر البرمجيات في بيئات سريرية مزدحمة.

لماذا تهم موجة النشر الآن

ينقل المصدر عن وينز وصفها لتغير حاد خلال السنوات القليلة الماضية: فقد انتقل الأطباء ونظم الرعاية الصحية من الشك إلى النشر الفعلي. هذا التوقيت مهم. فبمجرد أن تندمج الأدوات في سير العمل، يصبح تقييمها بشكل نظيف أصعب، كما يصبح إزالتها أصعب. وتخلق المشتريات والتدريب والتكامل وعادات العاملين زخما. وبالفعل، قد تكون نظم الرعاية الصحية تثبت تقنيات قبل بناء قاعدة الأدلة التي ينبغي أن تبررها.

هذا ليس حجة ضد الذكاء الاصطناعي الطبي. بل هو حجة ضد اعتبار الاعتماد بحد ذاته دليلا. لقد أدرك الطب منذ زمن طويل الفرق بين المؤشر البديل والنهاية الحقيقية. وينبغي أن تنطبق الدرجة نفسها من الانضباط هنا. قد يكون تسريع التوثيق، وتنظيف الملخصات، وارتفاع الدقة في المعايير أمورا مفيدة. لكن لا ينبغي الخلط بينها وبين تحسن الصحة ما لم تُقاس على هذا الأساس.

المجال يحتاج إلى أدلة على مستوى النتائج

أهم مساهمة في حجة Nature Medicine أنها تعيد صياغة عبء الإثبات. فالسؤال ليس ما إذا كان الذكاء الاصطناعي قادرا على إنتاج مخرجات مبهرة. فمن الواضح أنه قادر. والسؤال هو ما إذا كانت تلك المخرجات تغير الرعاية بطريقة تفيد المرضى بشكل قابل للقياس.

وهذا يتطلب تصميما بحثيا أكثر صرامة، ومراقبة أقوى بعد النشر، واستعدادا للسؤال عمّا إذا كانت الأداة الشائعة تغير القرارات أو النتائج فعلا إلى الأفضل. لدى الرعاية الصحية كل الأسباب لتبني الأتمتة المفيدة. ولديها السبب نفسه لمقاومة الخلط بين الراحة والفعالية.

ومع استمرار المستشفيات في دمج الذكاء الاصطناعي في الممارسة اليومية، ستصبح هذه الدرجة من الانضباط أكثر أهمية، لا أقل. فالأنظمة موجودة بالفعل. وما يزال غير محسوم هو ما إذا كانت تجعل الطب أفضل في النقاط الأكثر أهمية.

هذه المقالة مبنية على تقرير من MIT Technology Review. اقرأ المقال الأصلي.

Originally published on technologyreview.com