প্রমাণের চেয়ে দ্রুত ছড়িয়ে পড়ছে চিকিৎসা AI

Nature Medicine-এ প্রকাশিত একটি সম্পাদকীয় স্বাস্থ্যপ্রযুক্তির সবচেয়ে বড় ফাঁকগুলোর একটির দিকে সরাসরি আঙুল তুলেছে: শিল্প এখন AI টুল তৈরি করতে অনেক বেশি দক্ষ, কিন্তু সেই টুলগুলো বাস্তবে চিকিৎসা-সেবার মান বাড়ায়, তার ধারাবাহিক প্রমাণ এখনো নেই। পূর্বাভাসমূলক মডেল, সিদ্ধান্ত-সহায়ক ব্যবস্থা এবং জেনারেটিভ টুল ইতিমধ্যেই ক্লিনিক্যাল পরিবেশে ঢুকছে, আর বড় ভাষা মডেলও মানুষ স্বাস্থ্য তথ্যের জন্য ব্যবহার করছে। সম্পাদকীয় বলছে, স্বাস্থ্যসেবায় গ্রহণের গতি বাড়ছে, কিন্তু বাস্তব-জগতের মূল্য সম্পর্কে প্রমাণ সীমিতই রয়ে গেছে।

এই পার্থক্যটাই লেখাটির মূল কথা। চিকিৎসা AI কাগজে খুবই চমকপ্রদ দেখাতে পারে, বিশেষ করে যখন ডেভেলপাররা sensitivity, specificity, discrimination বা calibration-এর মতো পরিসংখ্যানগত মাপকাঠি রিপোর্ট করেন। এই সংখ্যাগুলো দেখায় একটি সিস্টেম গণনাগতভাবে কীভাবে কাজ করছে। কিন্তু সেগুলো স্বয়ংক্রিয়ভাবে প্রমাণ করে না যে রোগীরা ভালো চিকিৎসা পাচ্ছেন, চিকিৎসকেরা আরও ভালো সিদ্ধান্ত নিচ্ছেন, বা বাস্তবায়নের পর স্বাস্থ্যব্যবস্থা আরও কার্যকরভাবে চলছে।

কেন কর্মক্ষমতার মাপকাঠি যথেষ্ট নয়

সম্পাদকীয়ের যুক্তি হলো, স্বাস্থ্যসেবা যাচাইয়ের ধারণা খুব সংকীর্ণ হয়ে পড়েছে। একটি মডেল retrospective testing-এ ভালো স্কোর করতে পারে, তবু ক্লিনিক্যালভাবে ব্যর্থ হতে পারে যদি তা ভুল সময়ে আসে, বোঝা কঠিন হয়, কর্মীরা তা উপেক্ষা করেন, বা বিদ্যমান workflow-এ বিঘ্ন ঘটায়। অন্য কথায়, প্রযুক্তিগত সাফল্য আর চিকিৎসাগত লাভ এক জিনিস নয়।

এটি কোনো ছোটখাটো একাডেমিক অভিযোগ নয়। হাসপাতাল বা সেবাদাতা যদি মূলত performance metrics-এর ভিত্তিতে টুল গ্রহণ করে, তবে তারা এমন পণ্যের ওপর টাকা ও সময় খরচ করতে পারে য deren ব্যবহারিক মূল্য অস্পষ্ট। আরও খারাপ, তারা এমন নতুন ক্ষতি বা অদক্ষতা আনতে পারে যা benchmark study-তে ধরা পড়ে না। সম্পাদকীয় সতর্ক করে যে, এই ক্ষেত্রের বর্তমান অভ্যাস অকাল প্রয়োগের ঝুঁকি তৈরি করছে, আংশিকভাবে কারণ impact-সংক্রান্ত দাবি papers এবং product materials-এ আরও বেশি দেখা যাচ্ছে, যদিও evidence standards এখনও অস্পষ্ট।

আসল ক্লিনিক্যাল লাভ যখন প্রশ্নের কেন্দ্রে থাকে, চিকিৎসাবিদ্যা দীর্ঘদিন ধরে আরও শক্তিশালী প্রমাণ-শৃঙ্খলা দাবি করে এসেছে। drug development তার একটি সুস্পষ্ট উদাহরণ। নতুন ওষুধকে শুধু দেখে বিচার করা হয় না যে তারা biochemical effect তৈরি করছে কি না বা প্রাথমিক ল্যাব কাজে আশাব্যঞ্জক দেখাচ্ছে কি না। তারা পর্যায়ভিত্তিক evidence requirements পেরোয়, আর public oversight ঠিক করে যে অনুমোদন, সুপারিশ বা reimbursement-এর জন্য প্রমাণ কখন যথেষ্ট।

সম্পাদকীয় বলছে, চিকিৎসা AI এখনও এমন তুলনাযোগ্য নিয়ম গড়ে তোলেনি। এর মানে এই নয় যে সফটওয়্যারকে ওষুধের মতো একেবারে একইভাবে নিয়ন্ত্রণ করা উচিত। প্রযুক্তিগুলো খুব দ্রুত বদলাচ্ছে, ব্যবহারক্ষেত্র ব্যাপকভাবে ভিন্ন, এবং evidence generation-এর প্রণোদনাও সমান নয়। কিন্তু কোম্পানি ও প্রতিষ্ঠান যদি দাবি করতে চায় যে AI চিকিৎসা উন্নত করে, তবে ক্ষেত্রটিকে এমন একটি কাঠামো দরকার যা সেই দাবিকে দাবির মাত্রার সঙ্গে সামঞ্জস্যপূর্ণ প্রমাণের সঙ্গে যুক্ত করে।