প্রমাণের চেয়ে দ্রুত ছড়িয়ে পড়ছে চিকিৎসা AI

Nature Medicine-এ প্রকাশিত একটি সম্পাদকীয় স্বাস্থ্যপ্রযুক্তির সবচেয়ে বড় ফাঁকগুলোর একটির দিকে সরাসরি আঙুল তুলেছে: শিল্প এখন AI টুল তৈরি করতে অনেক বেশি দক্ষ, কিন্তু সেই টুলগুলো বাস্তবে চিকিৎসা-সেবার মান বাড়ায়, তার ধারাবাহিক প্রমাণ এখনো নেই। পূর্বাভাসমূলক মডেল, সিদ্ধান্ত-সহায়ক ব্যবস্থা এবং জেনারেটিভ টুল ইতিমধ্যেই ক্লিনিক্যাল পরিবেশে ঢুকছে, আর বড় ভাষা মডেলও মানুষ স্বাস্থ্য তথ্যের জন্য ব্যবহার করছে। সম্পাদকীয় বলছে, স্বাস্থ্যসেবায় গ্রহণের গতি বাড়ছে, কিন্তু বাস্তব-জগতের মূল্য সম্পর্কে প্রমাণ সীমিতই রয়ে গেছে।

এই পার্থক্যটাই লেখাটির মূল কথা। চিকিৎসা AI কাগজে খুবই চমকপ্রদ দেখাতে পারে, বিশেষ করে যখন ডেভেলপাররা sensitivity, specificity, discrimination বা calibration-এর মতো পরিসংখ্যানগত মাপকাঠি রিপোর্ট করেন। এই সংখ্যাগুলো দেখায় একটি সিস্টেম গণনাগতভাবে কীভাবে কাজ করছে। কিন্তু সেগুলো স্বয়ংক্রিয়ভাবে প্রমাণ করে না যে রোগীরা ভালো চিকিৎসা পাচ্ছেন, চিকিৎসকেরা আরও ভালো সিদ্ধান্ত নিচ্ছেন, বা বাস্তবায়নের পর স্বাস্থ্যব্যবস্থা আরও কার্যকরভাবে চলছে।

কেন কর্মক্ষমতার মাপকাঠি যথেষ্ট নয়

সম্পাদকীয়ের যুক্তি হলো, স্বাস্থ্যসেবা যাচাইয়ের ধারণা খুব সংকীর্ণ হয়ে পড়েছে। একটি মডেল retrospective testing-এ ভালো স্কোর করতে পারে, তবু ক্লিনিক্যালভাবে ব্যর্থ হতে পারে যদি তা ভুল সময়ে আসে, বোঝা কঠিন হয়, কর্মীরা তা উপেক্ষা করেন, বা বিদ্যমান workflow-এ বিঘ্ন ঘটায়। অন্য কথায়, প্রযুক্তিগত সাফল্য আর চিকিৎসাগত লাভ এক জিনিস নয়।

এটি কোনো ছোটখাটো একাডেমিক অভিযোগ নয়। হাসপাতাল বা সেবাদাতা যদি মূলত performance metrics-এর ভিত্তিতে টুল গ্রহণ করে, তবে তারা এমন পণ্যের ওপর টাকা ও সময় খরচ করতে পারে য deren ব্যবহারিক মূল্য অস্পষ্ট। আরও খারাপ, তারা এমন নতুন ক্ষতি বা অদক্ষতা আনতে পারে যা benchmark study-তে ধরা পড়ে না। সম্পাদকীয় সতর্ক করে যে, এই ক্ষেত্রের বর্তমান অভ্যাস অকাল প্রয়োগের ঝুঁকি তৈরি করছে, আংশিকভাবে কারণ impact-সংক্রান্ত দাবি papers এবং product materials-এ আরও বেশি দেখা যাচ্ছে, যদিও evidence standards এখনও অস্পষ্ট।

আসল ক্লিনিক্যাল লাভ যখন প্রশ্নের কেন্দ্রে থাকে, চিকিৎসাবিদ্যা দীর্ঘদিন ধরে আরও শক্তিশালী প্রমাণ-শৃঙ্খলা দাবি করে এসেছে। drug development তার একটি সুস্পষ্ট উদাহরণ। নতুন ওষুধকে শুধু দেখে বিচার করা হয় না যে তারা biochemical effect তৈরি করছে কি না বা প্রাথমিক ল্যাব কাজে আশাব্যঞ্জক দেখাচ্ছে কি না। তারা পর্যায়ভিত্তিক evidence requirements পেরোয়, আর public oversight ঠিক করে যে অনুমোদন, সুপারিশ বা reimbursement-এর জন্য প্রমাণ কখন যথেষ্ট।

সম্পাদকীয় বলছে, চিকিৎসা AI এখনও এমন তুলনাযোগ্য নিয়ম গড়ে তোলেনি। এর মানে এই নয় যে সফটওয়্যারকে ওষুধের মতো একেবারে একইভাবে নিয়ন্ত্রণ করা উচিত। প্রযুক্তিগুলো খুব দ্রুত বদলাচ্ছে, ব্যবহারক্ষেত্র ব্যাপকভাবে ভিন্ন, এবং evidence generation-এর প্রণোদনাও সমান নয়। কিন্তু কোম্পানি ও প্রতিষ্ঠান যদি দাবি করতে চায় যে AI চিকিৎসা উন্নত করে, তবে ক্ষেত্রটিকে এমন একটি কাঠামো দরকার যা সেই দাবিকে দাবির মাত্রার সঙ্গে সামঞ্জস্যপূর্ণ প্রমাণের সঙ্গে যুক্ত করে।

একটি কাঠামো, যা এখনও নেই

সম্পাদকীয়ের সবচেয়ে গুরুত্বপূর্ণ অবদান হলো proportionate evidence-এর ওপর জোর। workflow support নিয়ে একটি সীমিত দাবি একধরনের validation চাইতে পারে। কিন্তু যদি দাবি হয় যে একটি টুল রোগীর ফল উন্নত করে, চিকিৎসার সিদ্ধান্ত বদলায় বা সিস্টেম-ব্যাপী খরচ কমায়, তবে আরও অনেক বেশি প্রমাণ দরকার। এখন, লেখাটির মতে, এই পার্থক্যগুলো প্রায়ই গুলিয়ে যায়।

এটি গুরুত্বপূর্ণ, কারণ AI পণ্য নিরপেক্ষ পরিবেশে প্রবেশ করছে না। ক্লিনিক্যাল সেটিংগুলো ভিড়ভাট্টা, চাপপূর্ণ এবং খুবই পরিবর্তনশীল। একটি প্রতিষ্ঠানে ভালো কাজ করা টুল অন্য প্রতিষ্ঠানে ভিন্নভাবে কাজ করতে পারে, কারণ staffing, patient populations, data systems এবং operational constraints আলাদা। সম্মত evaluation framework না থাকলে, কেনা ও বাস্তবায়নের সিদ্ধান্ত নিতে গিয়ে স্বাস্থ্যব্যবস্থা vendor narratives বা অসম্পূর্ণ study design-এর ওপর নির্ভর করতে পারে।

সম্পাদকীয় আরও একটি বৃহত্তর প্রাতিষ্ঠানিক পিছিয়ে থাকার কথা বলে। regulatory frameworks এখনও তৈরি হচ্ছে, এবং AI deployment-এর গতি ও বৈচিত্র্যের তুলনায় সেগুলো অপর্যাপ্ত। Meanwhile, published studies প্রায়ই দেখায় না যে একটি system examination room, ward বা care pathway-এ কী বদলায়। ফলে provider, payer এবং policymaker-দের সিদ্ধান্ত নেওয়ার জন্য একটি অস্থির ভিত্তি থেকে যায়।

ভালো প্রমাণ কেমন হওয়া উচিত

এই লেখাটি সমস্যাটিকে একটি নির্দিষ্ট পদ্ধতিতে নামিয়ে আনে না, তবে এটি ক্ষেত্রটিকে আরও শক্তিশালী evaluation-এর দিকে ঠেলে দেয়। এর মানে retrospective performance reporting ছাড়িয়ে timing, usability, uptake, clinician behavior, workflow integration এবং measurable outcomes নিয়ে কঠিন প্রশ্ন তোলা। AI-কে একটি স্বতন্ত্র computational artifact নয়, বরং প্রেক্ষাপটে বিচার করা।

একটি decision-support model-এর ক্ষেত্রে, ভালো প্রমাণ মানে হতে পারে দেখানো যে চিকিৎসকেরা output ধারাবাহিকভাবে বুঝতে এবং কাজে লাগাতে পারেন। triage বা prediction tool-এর ক্ষেত্রে, এটি দেখাতে হতে পারে যে নতুন inequity বা delay না এনে চিকিৎসা উন্নত হয়। generative system-এর ক্ষেত্রে, outputs যে কেবল সম্ভাব্য নয়, বাস্তব পরিবেশে নির্ভরযোগ্য, বোধগম্য এবং উপকারী, তা প্রমাণ করতে হতে পারে।

জবাবদিহির প্রশ্নও আছে। ক্লিনিক্যাল প্রভাবের দাবি যদি প্রমাণকে ছাড়িয়ে যেতে থাকে, তাহলে হাসপাতাল ও চিকিৎসকদের মধ্যে বিভ্রান্তি আর রোগীদের মধ্যে সন্দেহ তৈরি হবে। সম্পাদকীয় কার্যত বলছে, শক্তিশালী মানদণ্ড উদ্ভাবনের ব্রেক নয়; বরং AI গ্রহণকে আরও বিশ্বাসযোগ্য ও টেকসই করার উপায়।

স্বাস্থ্যব্যবস্থার জন্য ঝুঁকি

উৎপাদনশীলতা বাড়ানো, চাপ কমানো এবং কর্মশক্তির সংকট মোকাবিলার তীব্র চাপের কারণে স্বাস্থ্যসেবা প্রযুক্তিগত হাইপের প্রতি বিশেষভাবে সংবেদনশীল। AI পণ্য এই চাহিদার সঙ্গে সহজেই মিলে যায়। কিন্তু সম্পাদকীয় সতর্ক করে যে স্বাস্থ্যব্যবস্থা এমন টুলে বিনিয়োগ করতে পারে যার সুবিধা অনিশ্চিত এবং যার অনিচ্ছাকৃত পরিণতি উল্লেখযোগ্য হতে পারে।

এই সতর্কতা এমন সময়ে এসেছে যখন AI pilot program থেকে নিয়মিত ক্লিনিক্যাল পরিবেশে ঢুকছে। ক্ষেত্রটি আর কাল্পনিক deployment নিয়ে কথা বলছে না। এটি এখন operational decision নিচ্ছে। এই প্রেক্ষাপটে, একটি shared evidence framework-এর অভাব কেবল methodological gap নয়; এটি governance problem হয়ে ওঠে।

সম্পাদকীয়ের অবস্থান সহজ: যদি AI চিকিৎসায় মূল্য দাবি করতে চায়, তবে যে ধরনের প্রভাবের প্রতিশ্রুতি দেওয়া হচ্ছে, সেই ধরনের প্রভাবের উপযোগী প্রমাণের মাধ্যমে সেই দাবি অর্জন করতে হবে। প্রযুক্তিগত metric এখনও গুরুত্বপূর্ণ, কিন্তু সেগুলো evaluation-এর শুরু, শেষ নয়।

চিকিৎসা AI-এর পরবর্তী ধাপের জন্য একটি কার্যকর সংশোধন

বর্তমান চিকিৎসা AI বিতর্ক প্রায়ই উৎসাহ আর আতঙ্কের মধ্যে দুলতে থাকে। Nature Medicine আরও শৃঙ্খলাপূর্ণ কিছুর পক্ষে বলছে: এমন একটি প্রমাণ-মান, যা একটি টুল গণনাগতভাবে কী করে এবং ক্লিনিক্যালভাবে কী বদলায়, সেই দুইকে যুক্ত করে। AI চিকিৎসাকে বদলে দেবে, এমন ঘোষণার চেয়ে এটি কম ঝলমলে বার্তা, কিন্তু অনেক বেশি জরুরি।

ক্ষেত্রটি যদি এই নিয়মগুলো তৈরি করে, তবে গ্রহণ আরও চিন্তাশীল ও বিশ্বাসযোগ্য হতে পারে। তা না হলে, প্রযুক্তিগত নতুনত্ব যে প্রমাণিত সুবিধাকে ছাড়িয়ে যায়, সেই পরিচিত ধরণটি স্বাস্থ্যসেবা আবারও পুনরাবৃত্তি করার ঝুঁকি নেবে। এমন একটি ক্ষেত্রে যেখানে ভুলের পরিণতি অত্যন্ত বেশি, সেই ফাঁক দ্রুত পূরণ করা মূল্যবান।

এই নিবন্ধটি Nature Medicine-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধটি পড়ুন.

Originally published on nature.com