
اختبار دقة ChatGPT في الفرز الطبي في دراسة سريرية منظمة
دراسة جديدة نُشرت في Nature Medicine تقيّم أداء ChatGPT في تقديم توصيات الفرز باستخدام سيناريوهات سريرية منظمة. تقدم النتائج واحداً من أشد التقييمات صرامة حتى الآن حول ما إذا كانت نماذج اللغة الكبيرة يمكنها المساعدة بموثوقية في اتخاذ القرارات الطبية.
- اختبرت دراسة Nature Medicine قدرة ChatGPT على تقديم توصيات الفرز الطبي باستخدام سيناريوهات سريرية معيارية
- أظهر النموذج أداء جيدة في الحالات الحرجة الواضحة لكنه كافح مع القرارات الدقيقة متوسطة الإلحاح
- عدم الاتساق في التقييمات المتكررة يثير مخاوف الموثوقية للنشر السريري
- يوصي الباحثون بالتعاون بين الإنسان والذكاء الاصطناعي بدلاً من أنظمة الفرز المستقلة للذكاء الاصطناعي








