مشكلة في نزاهة النشر أصبحت قابلة للقياس على نطاق واسع

أظهر استعراض واسع للأوراق الطبية الحيوية ارتفاعًا حادًا في المراجع المفبركة منذ 2023، ما يثير القلق من تسلل أخطاء الاستشهاد المولدة بالذكاء الاصطناعي إلى الأدبيات التي تساعد في تشكيل الفهم السريري، وفي بعض الحالات الإرشادات. ووفقًا للنص الأصلي المرفق، فحص باحثون من جامعة كولومبيا ومؤسسات أخرى 2.47 مليون ورقة في أرشيف PubMed Central المفتوح، تغطي منشورات من يناير 2023 حتى فبراير 2026. ومن أصل 97.1 مليون مرجع جرى التحقق منها، تم تصنيف 4046 على أنها مفبركة عبر 2810 ورقة.

حجم مجموعة البيانات مهم. لقد دارت المخاوف بشأن الاستشهادات المختلقة من النماذج اللغوية لسنوات، لكن المادة المقدمة تصف هذا على أنه أكبر استعراض حتى الآن للمراجع الطبية الحيوية. وهذا يحول المشكلة من حالة متفرقة إلى ما يشبه التحذير المنهجي. فإذا كانت المراجع المفبركة تظهر في آلاف الأوراق، فإن القضية لم تعد محصورة في أخطاء فردية أو سوء استخدام هاوٍ، بل تصبح تحديًا لسير عمل النشر العلمي نفسه.

أكثر ما يلفت النظر في النص الأصلي هو خط الاتجاه. فخلال عام 2023، ظل المعدل يدور حول أربع مراجع مفبركة لكل 10 آلاف ورقة. بدءًا من منتصف 2024، ارتفع بشكل حاد، ليصل إلى 51.3 لكل 10 آلاف ورقة بنهاية 2025، و56.9 لكل 10 آلاف في الأسابيع السبعة الأولى من 2026. وهذا يمثل زيادة بأكثر من اثني عشر ضعفًا مقارنة بخط الأساس السابق.

التوقيت يعزز فرضية الذكاء الاصطناعي، لكنه لا يثبت الحصرية

يرى المؤلفون الذين استشهد بهم النص الأصلي رابطًا محتملًا وواضحًا مع الاستخدام الواسع للنماذج اللغوية مثل ChatGPT. ويستند منطقهم إلى التسلسل الزمني وكذلك إلى الجوانب التقنية. فبما أن مولدات النصوص العامة أصبحت واسعة الانتشار بعد أواخر 2022، وبما أن النشر الأكاديمي يستغرق غالبًا من 100 إلى 200 يوم من التقديم إلى الظهور، فمن المتوقع أن يظهر أثر الكتابة بمساعدة الذكاء الاصطناعي في أرشيفات مثل PubMed Central بحلول منتصف 2024 تقريبًا. وهذا بالضبط هو موضع الارتفاع المبلغ عنه.

وفي الوقت نفسه، تشير المادة الأصلية إلى أن الباحثين لا يستبعدون أسبابًا أخرى. ويُذكر نشاط مصانع الأبحاث والتغييرات في ممارسات الفهرسة بوصفهما عاملين محتملين. وهذا التحفظ مهم. فالبيانات تبدو متسقة مع زيادة الاستشهادات المفبركة المدفوعة بالذكاء الاصطناعي، لكن المصدر لا يدعي إثباتًا حصريًا بأن النماذج اللغوية تفسر كل حالة بمفردها.

ومع ذلك، يظل المنطق مقنعًا. فالنماذج اللغوية الكبيرة معروفة بإنتاج مراجع تبدو معقولة، وتتبع التنسيق الصحيح، بل وتلصق باحثين حقيقيين بأوراق غير موجودة. وفي بيئة أكاديمية عالية الإنتاج، يمكن أن تمر هذه الأخطاء إذا لم يتحقق منها المؤلفون أو المحررون بعناية.

المشكلة ليست مجرد مراجع مزيفة، بل مراجع مزيفة تبدو موثوقة

أحد أكثر التفاصيل إثارة للقلق في المادة المقدمة هو مدى صعوبة اكتشاف هذه الاستشهادات المفبركة بالملاحظة البصرية. ويقول النص الأصلي إن المراجع الخاطئة غالبًا ما تتطابق مع موضوع الورقة، وتستخدم تنسيقًا صحيحًا، وتنسب العمل إلى باحثين حقيقيين، وتتضمن سنوات نشر قابلة للتصديق. وفي مثال مذكور، احتوت ورقة في مجال المسالك البولية على 18 مرجعًا مفبركًا من أصل 30 تم التحقق منها.

وهذا ما يجعل المشكلة خطيرة بشكل خاص في النشر الطبي الحيوي. فالاستشهاد المكسور بوضوح يمكن اكتشافه بسرعة، أما الاستشهاد المصقول لكنه غير الموجود فقد يمر عبر التحكيم وينتقل إلى السجل المنشور إذا لم يراجعه أحد في قواعد بيانات موثوقة. ويعكس تعريف الدراسة لـ “المفبرك” هذا القلق: كان يُوسم العنوان المستشهد به إذا تعذر العثور عليه في PubMed أو Crossref أو OpenAlex أو Google Scholar.

وتؤكد المادة الأصلية أيضًا أين تصبح المخاطر أكثر خطورة. فالمراجع المفبركة مقلقة بشكل خاص عندما تظهر في مقالات المراجعة، لأن هذه الأوراق غالبًا ما تلخص الأدلة لجماهير أوسع ويمكن أن تؤثر في الإرشادات السريرية. وإذا كانت البنية التي تستند إليها المراجعة تتضمن أدبيات مختلقة، فقد تمتد الآثار اللاحقة إلى ما هو أبعد من منشور واحد.

الاستجابة المقترحة هي مزيد من الأتمتة، لا مزيد من التساهل

يدعو الباحثون، وفقًا للنص الأصلي، إلى فحص آلي للمراجع قبل النشر، وإلى مسح رجعي للأوراق المنشورة بالفعل. وهذه التوصية عملية لأن المشكلة نفسها جزئيًا مشكلة حجم. فلا يمكن للمراجعين البشريين التحقق يدويًا من كل استشهاد عبر ملايين الأوراق، خاصة عندما تكون المراجع المزيفة مصممة لتبدو شرعية.

وتشير المادة الأصلية إلى أن منصات مثل arXiv قد أدخلت بالفعل عقوبات أولية على الأخطاء المرتبطة بالذكاء الاصطناعي. وهذا يدل على التحرك نحو معايير أشد، لكن النشر الطبي الحيوي يحتاج على الأرجح إلى أكثر من التحذيرات. فقد يصبح التحقق من المراجع خطوة تقنية روتينية في خطوط التحرير، مثل فحص الانتحال أو فحص الصور.

هناك أيضًا درس أوسع هنا. يمكن لأدوات الذكاء الاصطناعي أن تخفض تكلفة صياغة النص، لكنها قد تخفض أيضًا تكلفة إنتاج أكاذيب تبدو ذات مصداقية. وفي التواصل العلمي، هذه المقايضة خطيرة بشكل خاص لأن القراء يفترضون غالبًا أن جهاز الاستشهادات قد تم تدقيقه مسبقًا. وما إن يضعف هذا الافتراض حتى تتآكل الثقة في الأدبيات.

أصبح تحدي النزاهة جزءًا من قصة تبني الذكاء الاصطناعي

يشير هذا التدقيق الجديد إلى أن الاستشهادات المفبركة لم تعد قضية هامشية في النشر الطبي الحيوي. فهي تظهر بما يكفي من التكرار، وترتفع بسرعة كافية، لدرجة أنها تستدعي تغييرات في الإجراءات. سواء كان المحرك الرئيسي هو إساءة استخدام النماذج اللغوية أو مصانع الأبحاث أو مزيجًا من الأسباب، فإن الأثر العملي واحد: لم يعد يمكن التعامل مع المراجع على أنها موثوقة لمجرد أنها تبدو احترافية.

وهذا يمثل مشكلة خطيرة في أي مجال، لكنه أشد خطورة في مجال يمكن لمراجعاته وتوليفاته أن تساعد في تشكيل الإرشادات السريرية. والدرس المستفاد من المادة الأصلية ليس أن الذكاء الاصطناعي يجب أن يُستبعد من سير العمل البحثي، بل إن الكتابة بمساعدة الذكاء الاصطناعي دون تحقق صارم يمكن أن تلوث سلسلة الأدلة. وعندما يحدث ذلك على نطاق واسع، فإن كلفة المصداقية تمتد إلى ما هو أبعد من ورقة واحدة.

  • أظهر تدقيق لـ 2.47 مليون ورقة طبية حيوية وجود 4046 مرجعًا مفبركًا عبر 2810 ورقة.
  • يُقال إن معدل الاستشهادات المزيفة ارتفع بأكثر من اثني عشر ضعفًا من 2023 إلى أوائل 2026.
  • يرى الباحثون أن النماذج اللغوية عامل محتمل رئيسي، مع عدم استبعاد أسباب أخرى.
  • الاستشهادات المزيفة خطيرة بشكل خاص في مقالات المراجعة التي تؤثر في الفهم السريري والإرشادات.
  • يدعو مؤلفو الدراسة إلى فحص آلي للمراجع ومسح رجعي للأعمال المنشورة.

هذه المقالة مبنية على تقرير من The Decoder. اقرأ المقال الأصلي.

Originally published on the-decoder.com