হার্ভার্ড গবেষণা বলছে OpenAI মডেল প্রাথমিক ER নির্ণয়ে ডাক্তারদের হারিয়েছে

হার্ভার্ড-নেতৃত্বাধীন গবেষণায় দেখা গেছে এক OpenAI মডেল প্রাথমিক ER নির্ণয়ে চিকিৎসকদের ছাড়িয়ে গেছে

হার্ভার্ড মেডিকেল স্কুল ও বেথ ইসরায়েল ডিকনেসের নেতৃত্বে প্রকাশিত একটি Science পেপারে দেখা গেছে, একটি OpenAI মডেল জরুরি কক্ষের নির্ণয় ধাপগুলোতে উপস্থিত চিকিৎসকদের সমান বা তাদের চেয়ে ভালো করেছে, এবং এর সবচেয়ে বড় সুবিধা ছিল ট্রায়াজে

DT Editorial AI

May 3, 2026·4 min read·850 words

ঝুঁকি সবচেয়ে বেশি ছিল যখন, AI-এর সেরা প্রদর্শন তখনই দেখা গেল

এই সপ্তাহে

Science

-এ প্রকাশিত হার্ভার্ড-নেতৃত্বাধীন একটি গবেষণা চিকিৎসায় কৃত্রিম বুদ্ধিমত্তা কীভাবে ব্যবহার করা যেতে পারে, সেই বিতর্কে একটি গুরুত্বপূর্ণ তথ্য যোগ করেছে। প্রবন্ধটির সবচেয়ে নিবিড়ভাবে পর্যবেক্ষিত পরীক্ষাগুলোর একটিতে, গবেষকেরা Beth Israel Deaconess Medical Center-এর বাস্তব জরুরি কক্ষের রোগীদের ক্ষেত্রে OpenAI মডেলগুলোর নির্ণয়কে দুইজন অভ্যন্তরীণ চিকিৎসা বিভাগের উপস্থিত চিকিৎসকের নির্ণয়ের সঙ্গে তুলনা করেন। গবেষণা অনুযায়ী, OpenAI-এর o1 মডেল প্রতিটি নির্ণয়-পর্যায়ে মানব চিকিৎসকদের সমান বা তাদের চেয়ে ভালো ফল করেছে, এবং সবচেয়ে স্পষ্ট সুবিধা দেখা গেছে প্রাথমিক ER ট্রায়াজে।

এটি গুরুত্বপূর্ণ, কারণ ট্রায়াজ এমন এক জায়গা যেখানে চিকিৎসকদের কাছে সবচেয়ে কম তথ্য এবং সবচেয়ে কম সময় থাকে। গবেষণায় বলা হয়েছে, পার্থক্যগুলো বিশেষভাবে স্পষ্ট ছিল সেই প্রথম সংযোগবিন্দুতে, যখন চিকিৎসক ও হাসপাতালগুলো পূর্ণাঙ্গ পরীক্ষা-নিরীক্ষা উপলব্ধ হওয়ার আগে রোগীর অবস্থার সবচেয়ে সম্ভাব্য কারণ শনাক্ত করার চেষ্টা করছিল। সেই প্রাথমিক পর্যায়ে, গবেষকেরা জানিয়েছেন, o1 67% ক্ষেত্রে সঠিক বা খুব কাছাকাছি নির্ণয় দিয়েছে, যেখানে একজন উপস্থিত চিকিৎসকের ক্ষেত্রে তা ছিল 55% এবং অন্যজনের ক্ষেত্রে 50%।

তুলনাটি কীভাবে নকশা করা হয়েছিল

গবেষণা দলটির নেতৃত্ব দেন হার্ভার্ড মেডিকেল স্কুল এবং বেথ ইসরায়েল ডিকনেসের চিকিৎসক ও কম্পিউটার বিজ্ঞানীরা। উৎস উপাদানে আলোচিত জরুরি কক্ষের পরীক্ষায়, দলটি Beth Israel ER-এ আসা 76 জন রোগীর ওপর নজর দেয়। দুটি OpenAI মডেল, o1 এবং 4o, থেকে তৈরি নির্ণয়কে দুইজন অভ্যন্তরীণ চিকিৎসা বিভাগের উপস্থিত চিকিৎসকের নির্ণয়ের সঙ্গে তুলনা করা হয়।

এরপর সেই ফলাফলগুলো এমন দুইজন অন্য উপস্থিত চিকিৎসক পর্যালোচনা করেন, যাঁরা জানতেন না কোন নির্ণয় মানুষ দিয়েছে আর কোনটি AI সিস্টেমের। এই ব্লাইন্ডিং গুরুত্বপূর্ণ, কারণ এতে পর্যালোচকেরা প্রত্যাশার ভিত্তিতে নাকি গুণগত মানের ভিত্তিতে একটি উৎসকে অন্যটির চেয়ে বেশি গুরুত্ব দেবেন, সেই ঝুঁকি কমে।

গবেষকেরা আরও জোর দিয়ে বলেন যে, মডেলগুলোর কাছে তথ্য দেওয়ার আগে রোগীর ডেটা প্রি-প্রসেস করা হয়নি। বরং, AI সিস্টেমগুলো একই তথ্য পেয়েছে, যা প্রতিটি নির্ণয়ের সময় ইলেকট্রনিক মেডিকেল রেকর্ডে উপলব্ধ ছিল। এই বিষয়টি AI চিকিৎসা গবেষণার একটি পুনরাবৃত্ত সমালোচনার সরাসরি জবাব: মডেলগুলো কেবল তখনই চমকপ্রদ দেখাতে পারে, যখন তাদের পরিষ্কার, সরলীকৃত বা অস্বাভাবিকভাবে সম্পূর্ণ ইনপুট দেওয়া হয়। এখানে গবেষণা দলের দাবি হলো, মডেলগুলোকে বাস্তবে উপলব্ধ একই রকম অসম্পূর্ণ, খসড়া ক্লিনিক্যাল চিত্রে পরীক্ষা করা হয়েছে।

News

UAE এবং বাহরাইনে যুদ্ধ-ক্ষতিগ্রস্ত সুবিধাগুলি মেরামত করতে আরও কয়েক মাস লাগবে বলে Amazon Web Services জানিয়েছে, ফলে আঞ্চলিক ক্লাউড বিঘ্ন দীর্ঘায়িত হবে এবং ক্ষতিগ্রস্ত গ্রাহকদের বিলিং স্থগিত থাকবে।

DT Editorial AI·May 3, 2026·via arstechnica.com

News

Apple আর $599 Mac mini কনফিগারেশন বিক্রি করছে না বলে মনে হচ্ছে, ফলে 512GB মডেল নতুন প্রবেশমূল্য হিসেবে দাঁড়িয়েছে এবং শুরু দাম প্রায় $799 হয়েছে।

DT Editorial AI·May 3, 2026·via engadget.com

News

মেটা Assured Robot Intelligence অধিগ্রহণ করেছে, এর প্রতিষ্ঠাতা ও দল Superintelligence Labs-এ যোগ দিচ্ছে, আর কোম্পানি software, robot control, এবং whole-body humanoid systems-এ মনোযোগ বাড়াচ্ছে।

DT Editorial AI·May 3, 2026·via engadget.com

News

টেসলা আবার শাংহাইয়ে তৈরি Model 3 সেডান কানাডায় বিক্রি করছে, যুক্তরাষ্ট্র ও চীন থেকে আমদানির অর্থনীতি বদলে দেওয়া শুল্ক পরিবর্তনের পর প্রবেশমূল্য উল্লেখযোগ্যভাবে কমেছে.

ফলাফল কী বলে এবং কী বলে না

শিরোনামের ফলাফল উল্লেখযোগ্য, তবে তা সতর্কতার সঙ্গে ব্যাখ্যা করা উচিত। উৎস উপাদান একটি নির্ণয়-দক্ষতা গবেষণার কথা বলে, চিকিৎসকদের বদলে দেওয়ার পরীক্ষা নয়। ট্রায়াজে আরও সঠিক নির্ণয়-পরামর্শ দেওয়া মানে রোগীর যত্ন স্বাধীনভাবে পরিচালনা করা, ঝুঁকি জানানো, চিকিৎসা নির্ধারণ করা, বা ফলাফলের দায় নেওয়া নয়। জরুরি চিকিৎসা এই সবকিছুর ওপর নির্ভরশীল, এবং TechCrunch-এর প্রতিবেদনে স্পষ্টভাবে বলা হয়েছে যে এই গবেষণা চিকিৎসকদের বদলে দেওয়ার জন্য প্রস্তুত বলা হয়নি।

তবুও, এই গবেষণা সেই যুক্তিকে শক্তিশালী করে যে বড় ভাষা মডেলগুলো তীব্র চিকিৎসা-পরিস্থিতিতে অত্যন্ত কার্যকর সিদ্ধান্ত-সহায়ক টুল হয়ে উঠতে পারে, বিশেষ করে যখন তথ্য অল্প এবং সময়ের চাপ প্রচণ্ড। যদি কোনো মডেল আগেই নির্ণয়ের পরিসর সংকুচিত করতে সাহায্য করতে পারে, তবে তা দ্রুত আরও পরীক্ষা, রেফারাল, বা বিশেষজ্ঞ সম্পৃক্ততায় সহায়তা করতে পারে। এটি উচ্চ মানসিক চাপের মধ্যে কাজ করা চিকিৎসকদের জন্য বাদ পড়া সম্ভাবনাগুলোর বিরুদ্ধে একটি যাচাই হিসেবেও কাজ করতে পারে।

হার্ভার্ড মেডিকেল স্কুলের প্রধান লেখকদের একজন Arjun Manrai স্কুলের প্রেস রিলিজে বলেন, দলটি AI-কে বিস্তৃত মানদণ্ডের বিপরীতে পরীক্ষা করে দেখেছে এবং পেয়েছে যে এটি আগের মডেল এবং পেপারে ব্যবহৃত চিকিৎসক-ভিত্তিক মানদণ্ডকেও ছাড়িয়ে গেছে। দেওয়া উৎস পাঠ্যের সীমার মধ্যে, এটিই গবেষকদের নিজস্ব ব্যাখ্যার সবচেয়ে স্পষ্ট বক্তব্য: AI কেবল প্রতিযোগিতামূলক ছিল না, বরং এই গবেষণা নকশায় একটি মডেল নতুন অভ্যন্তরীণ মানদণ্ড স্থাপন করেছে।

ট্রায়াজ কেন গুরুত্বপূর্ণ ময়দান

ট্রায়াজ AI সিস্টেমের জন্য একটি বিশেষভাবে উন্মোচনকারী পরিবেশ, কারণ এটি অনিশ্চয়তাকে সংকুচিত করে। চিকিৎসকের কাছে প্রায়ই একটি ছোট নোট, উপসর্গের প্রথম সেট, এবং কী বাদ পড়া চলবে না তা নির্ধারণের প্রয়োজন থাকে। বড় ভাষা মডেলও এই ধরনের তথ্যের ধাঁচের সঙ্গে কাজ করার জন্য তৈরি: খণ্ডিত লেখা, আংশিক প্রেক্ষাপট, এবং সম্ভাবনাগুলো দ্রুত র‌্যাঙ্ক করার প্রয়োজন।

গবেষণার ফল ইঙ্গিত দেয়, উন্নত মডেলের জন্য এটি বিশেষভাবে অনুকূল একটি ব্যবহারক্ষেত্র হতে পারে। রেকর্ড যত কম সম্পূর্ণ হবে, ততই কোনো সিস্টেমের মূল্য বাড়তে পারে যদি তা ধারাবাহিকভাবে সবচেয়ে সম্ভাব্য বা সবচেয়ে বিপজ্জনক ব্যাখ্যাগুলো শনাক্ত করতে পারে। প্রথম সংযোগবিন্দুতে ব্যবধান সবচেয়ে বড় ছিল এই সত্যটি ইঙ্গিত করে যে, পূর্ণ রেকর্ড, ইমেজিং, এবং ল্যাব কাজ পাওয়া যাওয়ার পর নয়, বরং যত্নের একেবারে সামনের প্রান্তে AI সহায়তা সবচেয়ে বেশি কার্যকর হতে পারে।

তবে এটি সতর্কতার প্রয়োজন দূর করে না। ক্লিনিক্যাল ব্যবহারে বিভিন্ন হাসপাতাল জুড়ে যাচাই, চিকিৎসক তত্ত্বাবধান, ওয়ার্কফ্লো একীভূতকরণ, এবং মডেলের সুপারিশ ভুল, অসম্পূর্ণ, বা অতিরিক্ত আত্মবিশ্বাসী হলে কী হবে, এমন প্রশ্ন রয়ে যায়। একটি মাত্র গবেষণা, তা যতই উচ্চপ্রোফাইল হোক না কেন, এসব প্রশ্নের সমাধান করে না।

এর পর কী

এই প্রবন্ধের তাৎক্ষণিক গুরুত্ব হলো, এটি হাসপাতাল, নিয়ন্ত্রক সংস্থা, এবং স্বাস্থ্য-ব্যবস্থা নেতাদের জন্য শক্তিশালী প্রমাণ দেয় যে সর্বাধুনিক ভাষা মডেলগুলো ক্লিনিক্যাল পরিবেশে গুরুত্ব সহকারে মূল্যায়নের যোগ্য। নিকট ভবিষ্যতের সবচেয়ে বাস্তবসম্মত পথ হলো স্বয়ংক্রিয় নির্ণয় নয়, বরং বিদ্যমান যত্নদলগুলোর মধ্যে তত্ত্বাবধানে ব্যবহার।

যদি আরও গবেষণা বৃহত্তর রোগী গোষ্ঠী ও প্রতিষ্ঠানে অনুরূপ ফল নিশ্চিত করে, তবে হাসপাতালগুলো AI ট্রায়াজ সহায়তাকে পরীক্ষামূলক নতুনত্বের বদলে নির্ণয় সহায়তার একটি বাস্তব স্তর হিসেবে দেখতে শুরু করতে পারে। এর প্রভাব পড়বে স্টাফিং, চিকিৎসা প্রশিক্ষণ, দায়বদ্ধতার কাঠামো, এবং ইলেকট্রনিক রেকর্ড সফটওয়্যার নকশায়।

এখন এই গবেষণা আলাদা করে চোখে পড়ে, কারণ এটি আলোচনাকে অনুমানভিত্তিক প্রতিশ্রুতি থেকে বাস্তব জরুরি কক্ষের ক্ষেত্রে মাপা তুলনার দিকে নিয়ে যায়। চিকিৎসায়, সেটি একটি গুরুত্বপূর্ণ সীমারেখা। প্রশ্ন আর এই নয় যে AI কি বিশ্বাসযোগ্য ক্লিনিক্যাল ভাষা তৈরি করতে পারে। প্রশ্ন হলো, স্বাস্থ্যব্যবস্থা কি এমন টুলগুলো দায়িত্বের সঙ্গে ব্যবহার করতে প্রস্তুত, যেগুলো কিছু পরিস্থিতিতে অভিজ্ঞ চিকিৎসকদের আগেই সঠিক নির্ণয় চিনতে পারে।

এই নিবন্ধটি TechCrunch-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধটি পড়ুন.

হার্ভার্ড-নেতৃত্বাধীন গবেষণায় দেখা গেছে এক OpenAI মডেল প্রাথমিক ER নির্ণয়ে চিকিৎসকদের ছাড়িয়ে গেছে

ঝুঁকি সবচেয়ে বেশি ছিল যখন, AI-এর সেরা প্রদর্শন তখনই দেখা গেল

তুলনাটি কীভাবে নকশা করা হয়েছিল

Related Articles

Keep Reading

উবার তার ড্রাইভার নেটওয়ার্ককে স্বচালিত গাড়ির জন্য একটি ডেটা লেয়ারে রূপ দিতে চায়

ফলাফল কী বলে এবং কী বলে না

ট্রায়াজ কেন গুরুত্বপূর্ণ ময়দান

ক্যালিফোর্নিয়ার নতুন AV নিয়ম রোবোট্যাক্সি জবাবদিহিতাকে মোতায়েনের কেন্দ্রে এনেছে

এর পর কী

Comments (0)

এজেন্ট দৃশ্যমানতার নতুন স্তর হিসেবে Codex-এ AI-সৃষ্ট পোষা প্রাণী যোগ করল OpenAI

ড্রোনে ক্ষতির পর মধ্যপ্রাচ্যের ডেটা সেন্টার পুনরুদ্ধারে Amazon-এর কয়েক মাস লাগবে

AI চাহিদার ফলে Apple-এর সবচেয়ে সস্তা Mac Mini যেন হারিয়ে যাচ্ছে, কারণ লাইনআপ বদলে যাচ্ছে

হিউম্যানয়েড প্রচেষ্টা জোরদার করতে মেটা robotics AI startup ARI কিনেছে

শাংহাই আমদানির মাধ্যমে কানাডায় কমদামি Model 3 পথ আবার খুলল টেসলা