চিকিৎসা AI আদৌ কাজ করে কি না, প্রশ্নটি এখন আর মুখ্য নয়

স্বাস্থ্যসেবা AI এখন নতুনত্বের পর্যায় পেরিয়ে গেছে। হাসপাতালগুলো নোট নেওয়া, রেকর্ড পর্যালোচনা, ট্রায়াজ সহায়তা, ছবি বিশ্লেষণ, এবং চিকিৎসাসংক্রান্ত সুপারিশের জন্য AI ব্যবহার করছে। দেওয়া MIT Technology Review উৎসটি স্পষ্ট করে যে ক্ষেত্রটির এখন অন্য একটি সমস্যা আছে: প্রযুক্তিগত কর্মক্ষমতার প্রমাণ বাস্তব জীবনের ক্লিনিক্যাল উপকারের প্রমাণের চেয়ে দ্রুত আসছে।

এই পার্থক্যটি সহজেই গুলিয়ে যায়। কোনো মডেল প্যাটার্ন শনাক্তকরণ, স্ক্যান শ্রেণিবিন্যাস বা কথোপকথন সংক্ষিপ্তকরণে নির্ভুল হতে পারে। কিন্তু ওই কাজগুলিতে ভালো আউটপুট মানেই স্বয়ংক্রিয়ভাবে ভালো রোগীস্বাস্থ্য নয়। একটি টুল চিকিৎসকদের সময় বাঁচাতে পারে, পরিষ্কার কাগজপত্র তৈরি করতে পারে, বা সম্ভাব্য সুপারিশ দিতে পারে, তবু রোগ নির্ণয়, চিকিৎসা বা ফলাফল উন্নত করতে ব্যর্থ হতে পারে।

Ambient AI-এর উত্থান এই ফারাকটি দেখায়

সবচেয়ে স্পষ্ট উদাহরণগুলোর একটি হলো so-called ambient AI scribes-এর বিস্তার। এই সিস্টেমগুলো ডাক্তার-রোগী কথোপকথন শোনে, তা লিখে ফেলে, এবং সারাংশ তৈরি করে। উৎসে বলা হয়েছে, এগুলো ইতিমধ্যেই ব্যাপকভাবে ব্যবহৃত হচ্ছে এবং চিকিৎসকেরা প্রায়ই এতে উচ্চ সন্তুষ্টি জানান। প্রাথমিক গবেষণায় আরও ইঙ্গিত মিলছে যে এগুলো burnout কমাতে পারে।

এগুলো অর্থবহ লাভ। চিকিৎসায় প্রশাসনিক চাপই চাপের বাস্তব উৎস। AI যদি সেই বোঝার কিছুটা কমায়, তবে চিকিৎসকদের কাজের পরিবেশ উন্নত হতে পারে। কিন্তু উৎসে উদ্ধৃত গবেষক Jenna Wiens ও Anna Goldenberg বলছেন, মূল প্রশ্নটি এখনো খোলা: রোগীদের কী হয়? কোনো AI scribe যদি সূক্ষ্মভাবে কী নথিভুক্ত হলো, কী জোর দেওয়া হলো, বা কী বাদ পড়ল তা বদলে দেয়, তবে তা পরবর্তী সিদ্ধান্তগুলোকে এমনভাবে প্রভাবিত করতে পারে যা সন্তুষ্টি-সার্ভেতে ধরা পড়ে না।

নির্ভুলতা আর প্রভাব এক জিনিস নয়

একই সমস্যা পূর্বাভাসমূলক ও সুপারিশভিত্তিক সিস্টেমেও প্রযোজ্য। কোন রোগীর হস্তক্ষেপ লাগতে পারে, কোনো রোগ কী পথে অগ্রসর হতে পারে, বা কোনো চিকিৎসককে পরের ধাপে কী ভাবা উচিত তা শনাক্ত করতে হাসপাতালগুলো ক্রমেই মডেল ব্যবহার করছে। এই সিস্টেমগুলো প্রায়ই বেশি দক্ষতা ও সামঞ্জস্যতার প্রতিশ্রুতি নিয়ে আনা হয়। কিন্তু রোগীর ফলাফলের বিপরীতে মূল্যায়ন না করলে, এই ক্ষেত্রটি অপারেশনাল সুবিধাকে চিকিৎসাগত অগ্রগতি ভেবে ভুল করার ঝুঁকি তৈরি করে।

একটি মডেল সঠিক রোগীকে চিহ্নিত করতে পারে, কিন্তু এমন দেরিতে পারে যে তাতে আর কাজ না হয়। এটি সঠিক সুপারিশ দিতে পারে, কিন্তু চিকিৎসকেরা তা উপেক্ষা করতে পারেন। এটি কর্মীদের মনোযোগ এমনভাবে সরিয়ে দিতে পারে যাতে একদল উপকৃত হয় আর অন্যদল পিছিয়ে পড়ে। এগুলো প্রান্তিক ঘটনা নয়; ব্যস্ত ক্লিনিক্যাল পরিবেশে সফটওয়্যার স্থাপনের বাস্তবতা।

এখন এই deployment wave কেন গুরুত্বপূর্ণ

উৎসে Wiens-এর উদ্ধৃতি অনুযায়ী, গত কয়েক বছরে বড় পরিবর্তন এসেছে: চিকিৎসক ও স্বাস্থ্যব্যবস্থা সংশয় থেকে সক্রিয় ব্যবহারের দিকে গেছে। সময়টি গুরুত্বপূর্ণ। একবার টুলগুলো workflow-তে ঢুকে গেলে, সেগুলো পরিষ্কারভাবে মূল্যায়ন করা কঠিন হয়, আর সরানো আরও কঠিন। কেনাকাটা, প্রশিক্ষণ, সমন্বয়, এবং কর্মীদের অভ্যাস সব মিলিয়ে গতি তৈরি করে। কার্যত, স্বাস্থ্যব্যবস্থা হয়তো সেসব প্রযুক্তি লক-ইন করছে, যেগুলোকে ন্যায্যতা দেওয়ার মতো প্রমাণভিত্তি এখনও তৈরি হয়নি।

এটি চিকিৎসা AI-এর বিরুদ্ধে যুক্তি নয়। এটি দত্তক নেওয়াকেই প্রমাণ হিসেবে ধরা উচিত নয়, সেই যুক্তি। চিকিৎসাবিদ্যা surrogate marker আর সত্যিকারের endpoint-এর পার্থক্য বহুদিন ধরে মেনে এসেছে। এখানেও একই শৃঙ্খলা প্রযোজ্য হওয়া উচিত। ভালো ডকুমেন্টেশন গতি, পরিষ্কার সারাংশ, আর উচ্চ benchmark নির্ভুলতা সবই উপকারী হতে পারে। কিন্তু সেগুলোকে তেমনভাবেই মাপা না হলে, ভালো স্বাস্থ্য বলে ধরে নেওয়া যাবে না।

ক্ষেত্রটির outcome-গ্রেড প্রমাণ দরকার

Nature Medicine-এর যুক্তির সবচেয়ে গুরুত্বপূর্ণ অবদান হলো এটি প্রমাণের দায়কে নতুনভাবে সাজায়। প্রশ্নটি AI চমৎকার output তৈরি করতে পারে কি না, তা নয়। এটা স্পষ্টতই পারে। প্রশ্ন হলো, সেই outputগুলো কি এমন যত্নে বদল আনে যা পরিমাপযোগ্যভাবে রোগীর উপকার করে।

এর জন্য আরও কঠোর গবেষণা নকশা, deployment-পরবর্তী শক্তিশালী পর্যবেক্ষণ, এবং কোনো জনপ্রিয় টুল সত্যিই সিদ্ধান্ত বা ফলাফল ভালো করছে কি না তা প্রশ্ন করার মানসিকতা দরকার। স্বাস্থ্যসেবার দরকার আছে কার্যকর automation গ্রহণের। একইভাবে দরকার আছে সুবিধাকে কার্যকারিতা বলে ভুল না করার।

হাসপাতালগুলো যখন AI-কে দৈনন্দিন প্র্যাকটিসে একীভূত করে চলবে, সেই শৃঙ্খলা আরও গুরুত্বপূর্ণ হবে, কম নয়। সিস্টেমগুলো ইতিমধ্যেই এসে গেছে। এখনো অনির্ধারিত বিষয় হলো, সবচেয়ে গুরুত্বপূর্ণ জায়গায় সেগুলো চিকিৎসাকে উন্নত করছে কি না।

এই নিবন্ধটি MIT Technology Review-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.

Originally published on technologyreview.com