প্রকাশনার সততার সমস্যা এখন বড় পরিসরে পরিমাপযোগ্য হয়ে উঠেছে

জীববৈজ্ঞানিক পত্রিকার একটি বড় পর্যালোচনায় ২০২৩ সালের পর থেকে নকল রেফারেন্সের তীব্র বৃদ্ধি পাওয়া গেছে, যা নিয়ে উদ্বেগ তৈরি হয়েছে যে AI-উৎপাদিত সাইটেশন ত্রুটিগুলি এমন সাহিত্যে ঢুকে পড়ছে যা ক্লিনিকাল ধারণা এবং কিছু ক্ষেত্রে নির্দেশিকা গঠনে সহায়তা করে। প্রদত্ত উৎসপাঠ অনুযায়ী, কলম্বিয়া ইউনিভার্সিটি ও অন্যান্য প্রতিষ্ঠানের গবেষকেরা ওপেন PubMed Central আর্কাইভে ২.৪৭ মিলিয়ন পত্র পরীক্ষা করেছেন, যা জানুয়ারি ২০২৩ থেকে ফেব্রুয়ারি ২০২৬ পর্যন্ত প্রকাশিত কাজগুলোকে অন্তর্ভুক্ত করে। যাচাই করা ৯৭.১ মিলিয়ন রেফারেন্সের মধ্যে ৪,০৪৬টি ২,৮১০টি পত্রে নকল হিসেবে চিহ্নিত হয়েছে।

ডেটাসেটের পরিসর গুরুত্বপূর্ণ। ভাষা মডেল-নির্মিত কল্পিত উদ্ধৃতি নিয়ে উদ্বেগ বহু বছর ধরে রয়েছে, কিন্তু প্রদত্ত উপাদান এটিকে এখন পর্যন্ত হওয়া জীববৈজ্ঞানিক রেফারেন্সের সবচেয়ে বড় পর্যালোচনা হিসেবে তুলে ধরছে। এতে একটি বিচ্ছিন্ন গল্পভিত্তিক সমস্যাকে প্রায় পদ্ধতিগত সতর্কতায় পরিণত করা হয়েছে। যদি হাজার হাজার পত্রে নকল রেফারেন্স দেখা যায়, তবে এটি আর শুধু বিচ্ছিন্ন ভুল বা অপেশাদার অপব্যবহার নয়। এটি বৈজ্ঞানিক প্রকাশনার কাজের প্রবাহের জন্য একটি চ্যালেঞ্জ হয়ে দাঁড়ায়।

উৎসপাঠের সবচেয়ে চমকপ্রদ বিষয় হলো প্রবণতার রেখা। ২০২৩ জুড়ে, হারটি নাকি ১০,০০০ পত্রে প্রায় চারটি নকল রেফারেন্সেই ছিল। ২০২৪ সালের মাঝামাঝি থেকে তা তীব্রভাবে বাড়তে শুরু করে, ২০২৫ সালের শেষে প্রতি ১০,০০০ পত্রে ৫১.৩ এবং ২০২৬ সালের প্রথম সাত সপ্তাহে ৫৬.৯-এ পৌঁছে। এটি আগের ভিত্তির তুলনায় ১২ গুণেরও বেশি বৃদ্ধি।

সময় নির্ধারণ AI অনুমানকে শক্তিশালী করে, তবে একক প্রমাণ দেয় না

উৎসপাঠে উদ্ধৃত লেখকদের কাছে ChatGPT-এর মতো ভাষা মডেলের ব্যাপক ব্যবহার একটি স্পষ্ট সম্ভাব্য সংযোগ হিসেবে দেখা যাচ্ছে। তাদের যুক্তি কালানুক্রমিক ও প্রযুক্তিগত দুটোই। যেহেতু সাধারণ উদ্দেশ্যের টেক্সট জেনারেটরগুলি ২০২২-এর শেষের পর ব্যাপকভাবে ব্যবহৃত হতে শুরু করে, এবং একাডেমিক প্রকাশনা প্রায়শই জমা থেকে প্রকাশ পর্যন্ত ১০০ থেকে ২০০ দিন নেয়, তাই AI-সহায়তায় লেখা খসড়ার প্রভাব PubMed Central-এর মতো আর্কাইভে ২০২৪-এর মাঝামাঝি সময়ে দৃশ্যমান হওয়া প্রত্যাশিত ছিল। রিপোর্ট করা উত্থান ঠিক সেখানেই শুরু হয়।

একই সঙ্গে, উৎস উপাদানটি বলছে গবেষকেরা অন্য কারণগুলো বাতিল করছেন না। পেপার-মিল কার্যক্রম এবং সূচীকরণ পদ্ধতিতে পরিবর্তন উভয়ই সম্ভাব্য সহায়ক কারণ হিসেবে উল্লেখ করা হয়েছে। এই সতর্কতা গুরুত্বপূর্ণ। ডেটা AI-চালিত সাইটেশন জালিয়াতি আরও সাধারণ হয়ে উঠছে বলে ইঙ্গিত দেয়, তবে উৎসটি দাবি করে না যে ভাষা মডেলই প্রতিটি ঘটনার একমাত্র ব্যাখ্যা।

তবু যুক্তি জোরালো। বড় ভাষা মডেল এমন রেফারেন্স তৈরি করতে পারে যা বিশ্বাসযোগ্য দেখায়, সঠিক ফরম্যাট মেনে চলে, এমনকি বাস্তব গবেষকদের অস্তিত্বহীন পত্রের সঙ্গে জুড়ে দেয়। উচ্চ-গতির একাডেমিক পরিবেশে, লেখক বা সম্পাদকরা যদি সেগুলো সাবধানে যাচাই না করেন, তবে এই ত্রুটিগুলি টিকে যেতে পারে।

সমস্যা শুধু ভুয়া রেফারেন্স নয়, বিশ্বাসযোগ্য দেখানো ভুয়া রেফারেন্স

প্রদত্ত উপাদানের সবচেয়ে উদ্বেগজনক বিবরণ হলো, এই নকল উদ্ধৃতিগুলি পরীক্ষা করে শনাক্ত করা কতটা কঠিন হতে পারে। উৎসপাঠে বলা হয়েছে, এই ভুয়া রেফারেন্সগুলো প্রায়ই পত্রের বিষয়ের সঙ্গে মিলে যায়, সঠিক ফরম্যাট ব্যবহার করে, বাস্তব গবেষকদের ক্রেডিট দেয়, এবং বিশ্বাসযোগ্য প্রকাশনার বছরও অন্তর্ভুক্ত করে। একটি উদ্ধৃত উদাহরণে, একটি ইউরোলজি পত্রে যাচাই করা ৩০টির মধ্যে ১৮টি রেফারেন্স নকল ছিল।

এটাই জীববৈজ্ঞানিক প্রকাশনায় বিষয়টিকে বিশেষভাবে বিপজ্জনক করে তোলে। দৃশ্যত ভাঙা একটি সাইটেশন দ্রুত ধরা যায়। কিন্তু ঝকঝকে অথচ অস্তিত্বহীন একটি সাইটেশন, যদি কেউ সেটিকে নির্ভরযোগ্য ডেটাবেসের সঙ্গে যাচাই না করে, তবে পিয়ার রিভিউ পেরিয়ে প্রকাশিত রেকর্ডে ঢুকে পড়তে পারে। গবেষণার “fabricated” সংজ্ঞা এই উদ্বেগকেই প্রতিফলিত করে: PubMed, Crossref, OpenAlex, বা Google Scholar-এ খুঁজে না পাওয়া শিরোনামকে চিহ্নিত করা হয়েছে।

উৎস উপাদানটি আরও জোর দিয়ে বলছে, ঝুঁকি কোথায় আরও গুরুতর হয়ে ওঠে। রিভিউ নিবন্ধে নকল রেফারেন্স বিশেষভাবে সমস্যাজনক, কারণ সেগুলি প্রায়শই বৃহত্তর পাঠকের জন্য প্রমাণ একত্র করে এবং ক্লিনিকাল নির্দেশিকাকে প্রভাবিত করতে পারে। একটি রিভিউয়ের কাঠামোতেই যদি নকল সাহিত্য থাকে, তাহলে তার প্রভাব একটি পত্রের বাইরে ছড়িয়ে পড়তে পারে।

প্রস্তাবিত প্রতিক্রিয়া আরও অটোমেশন, কম যাচাই নয়

উৎসপাঠ অনুযায়ী, গবেষকেরা প্রকাশের আগে স্বয়ংক্রিয় রেফারেন্স চেক এবং ইতিমধ্যে প্রকাশিত পত্রগুলোর রেট্রোস্পেকটিভ স্ক্রিনিংয়ের আহ্বান জানিয়েছেন। এই সুপারিশ বাস্তবসম্মত, কারণ সমস্যাটির একটি অংশই হলো স্কেলের সমস্যা। লক্ষ লক্ষ পত্রে প্রতিটি সাইটেশন মানুষের পক্ষে হাতে যাচাই করা সম্ভব নয়, বিশেষত যখন ভুয়া রেফারেন্সগুলো বৈধ মনে হওয়ার মতো করে তৈরি করা হয়।

উৎস উপাদানটি উল্লেখ করে যে arXiv-এর মতো প্ল্যাটফর্ম AI-সম্পর্কিত ত্রুটির জন্য প্রাথমিক নিষেধাজ্ঞা ইতিমধ্যে চালু করেছে। এটি কঠোর মানদণ্ডের দিকে অগ্রগতির ইঙ্গিত দেয়, কিন্তু জীববৈজ্ঞানিক প্রকাশনার জন্য শুধু সতর্কবার্তা যথেষ্ট নয়। রেফারেন্স যাচাইকে plagiarism checks বা image screening-এর মতো সম্পাদকীয় পাইপলাইনে নিয়মিত প্রযুক্তিগত ধাপ হতে হতে পারে।

এখানে আরও একটি বৃহত্তর শিক্ষা আছে। AI টুল খসড়া তৈরির খরচ কমাতে পারে, কিন্তু কর্তৃত্বপূর্ণ দেখানো মিথ্যা তৈরির খরচও কমায়। বৈজ্ঞানিক যোগাযোগে এই বিনিময়টি বিশেষভাবে বিপজ্জনক, কারণ পাঠকেরা ধরে নেন যে সাইটেশন কাঠামো ইতিমধ্যে যাচাই করা হয়েছে। সেই ধারণা দুর্বল হলে, সাহিত্যের ওপর আস্থা নষ্ট হয়।

AI গ্রহণের গল্পের অংশ হিসেবে এখন সততার চ্যালেঞ্জও রয়েছে

নতুন অডিট বলছে, জীববৈজ্ঞানিক প্রকাশনায় নকল রেফারেন্স আর প্রান্তিক সমস্যা নয়। এগুলি এত ঘন ঘন এবং এত দ্রুত বাড়ছে যে প্রক্রিয়াগত পরিবর্তন প্রয়োজন। মূল চালক ভাষা-মডেল অপব্যবহার হোক, পেপার-মিল হোক, বা উভয়ের সমন্বয় হোক, ব্যবহারিক ফল একই: রেফারেন্স কেবল পেশাদার দেখাচ্ছে বলেই নির্ভরযোগ্য ধরা যাবে না।

এটি যেকোনো ক্ষেত্রের জন্যই গুরুতর সমস্যা, বিশেষ করে এমন ক্ষেত্রের জন্য যেখানে রিভিউ ও সিনথেসিস ক্লিনিকাল নির্দেশিকা গঠনে সহায়তা করতে পারে। উৎস উপাদান থেকে পাওয়া শিক্ষা হলো, AI-কে গবেষণা কর্মপ্রবাহ থেকে সম্পূর্ণ বাদ দিতে হবে এমন নয়। বরং কঠোর যাচাই ছাড়া AI-সহায়তায় লেখা প্রমাণের শৃঙ্খলকে দূষিত করতে পারে। এটি যখন বড় পরিসরে ঘটে, তখন বিশ্বাসযোগ্যতার খরচ একটি পত্রের গণ্ডি ছাড়িয়ে ছড়িয়ে পড়ে।

  • ২.৪৭ মিলিয়ন জীববৈজ্ঞানিক পত্রের অডিটে ২,৮১০টি পত্রে ৪,০৪৬টি নকল রেফারেন্স পাওয়া গেছে।
  • ২০২৩ সালের পর থেকে ২০২৬-এর শুরু পর্যন্ত নকল সাইটেশনের হার ১২ গুণেরও বেশি বেড়েছে বলে জানা গেছে।
  • ভাষা মডেলকে একটি সম্ভাব্য কারণ হিসেবে চিহ্নিত করা হয়েছে, যদিও একমাত্র কারণ নয়।
  • ক্লিনিকাল ধারণা ও নির্দেশিকাকে প্রভাবিত করতে পারে এমন রিভিউ নিবন্ধে ভুয়া সাইটেশন বিশেষভাবে ঝুঁকিপূর্ণ।
  • গবেষকেরা স্বয়ংক্রিয় রেফারেন্স চেক এবং পূর্বপ্রকাশিত কাজের রেট্রোস্পেকটিভ স্ক্রিনিংয়ের আহ্বান জানিয়েছেন।

এই নিবন্ধটি The Decoder-এর প্রতিবেদনের ভিত্তিতে। মূল নিবন্ধটি পড়ুন.

Originally published on the-decoder.com