चिकित्सा AI के लिए एक नई चेतावनी
कृत्रिम बुद्धिमत्ता प्रणालियों को अब तेजी से मैमोग्राम, MRI, बायोप्सी और अन्य चिकित्सा छवियाँ पढ़ने के लिए प्रशिक्षित किया जा रहा है, अक्सर इस वादे के साथ कि इससे कार्यभार कम होगा और निदान की गति बढ़ेगी। लेकिन शोधकर्ताओं का कहना है कि इनमें से कुछ प्रणालियाँ एक विशेष रूप से चिंताजनक तरीके से विफल हो सकती हैं: वे ऐसी छवियों की भी संभावित व्याख्या प्रस्तुत कर सकती हैं जिन्हें वास्तव में उन्हें कभी दिखाया ही नहीं गया।
इस घटना को AI “मृगतृष्णा” कहा जा रहा है। Live Science की मूल रिपोर्ट के अनुसार, शोधकर्ताओं का कहना है कि आधुनिक मॉडल ऐसे दृश्य पदार्थों के विश्वसनीय विवरण उत्पन्न कर सकते हैं जो उन्हें प्रदान ही नहीं किए गए थे। इस तरह का व्यवहार साधारण त्रुटि से कहीं अधिक गंभीर चिंता पैदा करता है। चिकित्सा में सामान्य गलती भी पर्याप्त खराब होती है। लेकिन आत्मविश्वास भरी भाषा में लिपटी हुई, देखने में गढ़ी गई-सी व्याख्या संभावित रूप से इससे भी बदतर है, क्योंकि यह उन मनुष्यों को विश्वसनीय लग सकती है जिन्हें इसकी निगरानी करनी होती है।
यह चेतावनी ऐसे समय आई है जब चिकित्सा AI को लेकर उत्साह अभी भी मजबूत है। कुछ विश्लेषकों ने सुझाव दिया है कि ये प्रणालियाँ अंततः मानव छवि व्याख्या के बड़े हिस्सों की जगह ले सकती हैं। मृगतृष्णाओं के बारे में उभरती चिंता यह साबित नहीं करती कि ऐसा होना असंभव है, लेकिन यह इस धारणा को चुनौती देती है कि केवल क्षमता में वृद्धि अपने आप सुरक्षित नैदानिक तैनाती में बदल जाती है।
मृगतृष्णा मिस्ड डायग्नोसिस से अलग क्यों है
चिकित्सा इमेजिंग मॉडल अक्सर संवेदनशीलता, विशिष्टता या बेंचमार्क डेटासेट पर सटीकता जैसे परिचित मानकों से आँके जाते हैं। लेकिन मृगतृष्णाएँ जोखिम की एक अलग श्रेणी की ओर इशारा करती हैं। मुद्दा केवल यह नहीं है कि मॉडल स्कैन को सही ढंग से लेबल करता है या नहीं। मुद्दा यह है कि क्या मॉडल वास्तव में उस इनपुट पर आधारित है जो उसे मिला है।
यदि कोई प्रणाली ऐसे ढाँचे, रोगविज्ञान या विवरणों का आत्मविश्वास से वर्णन कर सकती है जो दी गई छवि में मौजूद ही नहीं हैं, तो चिकित्सक एक ऐसे उपकरण से निपट रहा है जो साक्ष्य से तर्क करता हुआ दिख सकता है, जबकि आंशिक रूप से अपने ही साक्ष्य आधार की कल्पना कर रहा होता है। उपभोक्ता AI में इस पैटर्न को “हैलुसिनेशन” कहा जा सकता है। चिकित्सा में, जहाँ मूल रिपोर्ट “मृगतृष्णा” शब्द का उपयोग करती है, इसका निहितार्थ अधिक गंभीर है क्योंकि गढ़ा गया आउटपुट स्क्रीनिंग, निदान, अनुवर्ती परीक्षण या उपचार विकल्पों को प्रभावित कर सकता है।
यह विशेष रूप से किनारे के मामलों में महत्वपूर्ण है, जहाँ डॉक्टर अक्सर AI सहायता की ओर तब मुड़ते हैं जब छवि अस्पष्ट होती है या कार्यभार भारी होता है। औसतन अच्छा प्रदर्शन करने वाली, लेकिन कभी-कभी बिना आधार की व्याख्या देने वाली प्रणाली सबसे कठिन तब पकड़ी जाती है जब उपयोगकर्ता स्वचालन पर सबसे अधिक भरोसा करने के लिए प्रवृत्त होते हैं।
नैदानिक वादा विश्वसनीयता की मांगों से टकराता है
चिकित्सा इमेजिंग AI का आकर्षण आसानी से समझ में आता है। स्वास्थ्य प्रणालियों को विशेषज्ञों की कमी, स्क्रीनिंग कार्यक्रमों में लंबित बैकलॉग और बढ़ती इमेजिंग मात्रा का सामना करना पड़ता है। एक ऐसा उपकरण जो असामान्यताओं को चिह्नित कर सके, स्कैन का वर्गीकरण कर सके, या निदान का समर्थन कर सके, स्पष्ट परिचालन अपील रखता है। यही कारण है कि इन प्रणालियों ने अस्पतालों, स्टार्टअप्स और निवेशकों का लगातार ध्यान खींचा है।
लेकिन चिकित्सा AI के लिए अन्य कई क्षेत्रों की तुलना में अधिक सख्त मानक लागू करती है। एक मॉडल सिर्फ उपयोगी नहीं होना चाहिए। उसे सामने मौजूद रोगी डेटा से विश्वसनीय रूप से जुड़ा होना चाहिए, ऑडिट करने के लिए पर्याप्त व्याख्येय होना चाहिए, और इतना पूर्वानुमेय होना चाहिए कि छिपे हुए विफलता मोड लाए बिना तैनात किया जा सके। मृगतृष्णा जैसा व्यवहार संकेत देता है कि मौजूदा प्रणालियाँ अभी भी इस सीमा का उल्लंघन ऐसे तरीकों से कर सकती हैं जिन्हें मानक मूल्यांकन पूरी तरह नहीं पकड़ पाते।
यह चिंता सैद्धांतिक रूप से काल्पनिक नहीं है। यदि शोधकर्ता अब चेतावनी दे रहे हैं कि मॉडल छवि विवरण गढ़ सकते हैं, तो डेवलपरों, नियामकों और नैदानिक अपनाने वालों को पूछना होगा कि क्या मौजूदा सत्यापन प्रथाएँ सही चीज़ को जाँच रही हैं। कोई मॉडल बेंचमार्क पर मजबूत परिणाम दे सकता है, फिर भी निर्णायक क्षणों में यदि उसकी प्रतीत होने वाली तर्कशक्ति वास्तविक छवि से अलग हो जाए, तो वह खतरनाक ढंग से व्यवहार कर सकता है।
अपनाने के लिए इसका क्या अर्थ है
सबसे तात्कालिक निहितार्थ सावधानी है। इमेज-विश्लेषण AI पर विचार कर रहे स्वास्थ्य संगठनों को प्रदर्शन दावों को पर्याप्त तत्परता के प्रमाण के रूप में मानने के बजाय निगरानी, तनाव-परीक्षण और मानवीय समीक्षा को मजबूत करने की आवश्यकता पड़ सकती है। प्रणालियों का मूल्यांकन केवल नैदानिक गुणवत्ता के लिए नहीं, बल्कि इनपुट निष्ठा के लिए भी किया जा सकता है: क्या वे वास्तव में दिए गए स्कैन का उत्तर दे रहे हैं, या वे ऐसे सीखे हुए पैटर्न से अंतराल भर रहे हैं जो केवल ग्राउंडेड व्याख्या जैसे दिखते हैं?
यह चेतावनी उत्पाद डिज़ाइन को भी प्रभावित कर सकती है। डेवलपरों को ऐसे मजबूत सुरक्षा-घेरों की आवश्यकता हो सकती है जो मॉडलों को अवलोकनीय विशेषताओं के अधिक निकट रहने के लिए मजबूर करें, या जनरेटिव प्रणालियों को नैदानिक कार्यों के लिए बनाए गए अधिक संकीर्ण आर्किटेक्चर के साथ जोड़ें। कुछ स्थितियों में, कम लचीला लेकिन छवि से अधिक विश्वसनीय रूप से जुड़ा मॉडल, ऐसे अधिक अभिव्यक्तिशील मॉडल से सुरक्षित हो सकता है जो कभी-कभी विवरण गढ़ देता है।
नियामकों के लिए यह मुद्दा AI शासन में एक परिचित तनाव की ओर इशारा करता है। समग्र प्रदर्शन पर आधारित अनुमोदन मार्ग दुर्लभ लेकिन गंभीर व्यवहारों को चूक सकते हैं। चिकित्सा में, दुर्लभ विफलता मोड महत्वपूर्ण होते हैं क्योंकि वे सीधे रोगी परिणामों को प्रभावित कर सकते हैं। इसलिए व्यापक तैनाती का पक्ष केवल इस पर निर्भर नहीं करता कि कोई प्रणाली कितनी बार सही है, बल्कि इस पर भी कि वह गलत कैसे होती है।
व्यापक सबक
यह विचार कि AI छवि व्याख्या में मानव विशेषज्ञों से आगे निकल सकता है, हमेशा केवल पैटर्न पहचान पर नहीं टिका रहा। यह विश्वास पर निर्भर करता है। चिकित्सकों को यह भरोसा चाहिए कि जब कोई प्रणाली किसी संदिग्ध विशेषता की ओर इशारा करती है, तो वह छवि पर प्रतिक्रिया दे रही है, न कि क्षमता का एक परिष्कृत भ्रम पैदा कर रही है।
मृगतृष्णा चेतावनियों का उभरना यह नहीं दर्शाता कि चिकित्सा इमेजिंग AI को छोड़ दिया जाना चाहिए। इसका अर्थ यह है कि यह क्षेत्र शायद एक अधिक संतुलित चरण में प्रवेश कर रहा है, जिसमें विश्वसनीयता, ग्राउंडिंग और ऑडिटेबिलिटी उतने ही महत्वपूर्ण होंगे जितने सुर्खियाँ बनाने वाले सटीकता लाभ। यह एक स्वस्थ सुधार होगा। नैदानिक उपकरण अपनी वैधता इसलिए नहीं कमाते कि वे स्मार्ट लगते हैं। वे इसे इसलिए कमाते हैं क्योंकि वे सही कारणों से, लगातार, सही होते हैं ताकि देखभाल का समर्थन कर सकें।
यदि चिकित्सा AI को प्रयोगात्मक वादे से नियमित ढाँचे तक पहुँचना है, तो उसे यह कसौटी पार करनी होगी। मृगतृष्णा व्यवहार याद दिलाता है कि स्वास्थ्य देखभाल में, विश्वसनीय लगने वाला आउटपुट भरोसेमंद साक्ष्य के बराबर नहीं होता।
यह लेख Live Science की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.
Originally published on livescience.com



