బయోమెడికల్ పత్రాల్లో నకిలీ AI సూచనలలో భారీ పెరుగుదలను అధ్యయనం గుర్తించింది

ప్రచురణ సమగ్రత సమస్య ఇప్పుడు పెద్ద స్థాయిలో కొలవదగినదిగా మారింది

బయోమెడికల్ పత్రాలపై చేసిన పెద్ద సమీక్షలో 2023 తర్వాత నుంచి నకిలీ సూచనలు గణనీయంగా పెరిగినట్లు కనుగొన్నారు, దీని వల్ల AI-సృష్టించిన సైటేషన్ లోపాలు క్లినికల్ అవగాహనను, కొన్ని సందర్భాల్లో మార్గదర్శకాలను కూడా ప్రభావితం చేసే సాహిత్యంలోకి జారుకుంటున్నాయనే ఆందోళన పెరిగింది. అందించిన మూల పాఠ్య ప్రకారం, కొలంబియా యూనివర్సిటీ మరియు ఇతర సంస్థల పరిశోధకులు ఓపెన్ PubMed Central ఆర్కైవ్‌లో 2.47 మిలియన్ పత్రాలను పరిశీలించారు, ఇది 2023 జనవరి నుంచి 2026 ఫిబ్రవరి వరకు ప్రచురితమైన వాటిని కవర్ చేస్తుంది. పరిశీలించిన 97.1 మిలియన్ సూచనల్లో 4,046 సూచనలు 2,810 పత్రాల్లో నకిలీవిగా గుర్తించబడ్డాయి.

డేటాసెట్ పరిమాణం ముఖ్యం. భాషా మోడళ్లు రూపొందించిన కల్పిత సూచనలపై ఆందోళనలు సంవత్సరాలుగా ఉన్నాయి; కానీ అందించిన పదార్థం దీన్ని ఇప్పటివరకు జరిగిన బయోమెడికల్ సూచనలలో అతి పెద్ద సమీక్షగా చూపిస్తోంది. ఇది ఒక అనుభవ ఆధారిత సమస్యను వ్యవస్థ స్థాయి హెచ్చరికగా మారుస్తుంది. వేలాది పత్రాల్లో నకిలీ సూచనలు కనిపిస్తే, అది ఇక వేరువేరు తప్పులు లేదా అనుభవరాహిత్య దుర్వినియోగం మాత్రమే కాదు. శాస్త్రీయ ప్రచురణ వర్క్‌ఫ్లోలకే సవాలుగా మారుతుంది.

మూల పాఠ్యంలో అత్యంత గమనార్హమైనది ధోరణి రేఖ. 2023 అంతటా, ఈ రేటు 10,000 పత్రాలకు సుమారు నాలుగు నకిలీ సూచనల వద్ద నిలిచిందని చెప్పబడింది. 2024 మధ్య నుండి అది వేగంగా పెరిగి, 2025 చివరికి 10,000 పత్రాలకు 51.3కి, 2026 మొదటి ఏడు వారాల్లో 56.9కి చేరింది. ఇది ప్రారంభ స్థాయితో పోలిస్తే 12 రెట్లు పైగా పెరుగుదల.

కాలక్రమం AI అనుమానాన్ని బలపరుస్తుంది, కానీ ఒక్కదానితోనే నిరూపించదు

మూల పాఠ్యంలో పేర్కొన్న రచయితలకు ChatGPT వంటి భాషా మోడళ్ల విస్తృత వినియోగంతో స్పష్టమైన సంబంధం కనిపిస్తోంది. వారి వాదన కాలక్రమంతో పాటు సాంకేతికమైనదీ. సాధారణ ప్రయోజనాల కోసం ఉపయోగించే టెక్స్ట్ జనరేటర్లు 2022 చివర తర్వాత విస్తృతంగా ప్రాచుర్యం పొందినందున, శాస్త్రీయ ప్రచురణలు సమర్పణ నుంచి వెలువడటానికి సాధారణంగా 100 నుంచి 200 రోజులు పట్టినందున, AI సహాయంతో రాసిన ముసాయిదాల ప్రభావం PubMed Central వంటి ఆర్కైవ్‌లలో 2024 మధ్యలో కనిపించాలి. నివేదించిన ఎగబాకడం అదే సమయంలో మొదలవుతోంది.

అదే సమయంలో, మూల పదార్థం ఇతర కారణాలను పరిశోధకులు పూర్తిగా తోసిపుచ్చలేదని పేర్కొంటుంది. పేపర్-మిల్ కార్యకలాపాలు మరియు సూచీకరణ పద్ధతుల మార్పులు రెండూ కూడా సాధ్యమైన సహాయక కారకాలుగా చెప్పబడ్డాయి. ఈ జాగ్రత్త ముఖ్యమైనది. డేటా AI-నడిచే సైటేషన్ సృష్టి మరింత సాధారణమవుతోందని సూచిస్తోంది, కానీ భాషా మోడళ్లే ప్రతి కేసును పూర్తిగా వివరించాయని మూలం చెప్పడం లేదు.

అయితే, తర్కం బలంగా ఉంది. పెద్ద భాషా మోడళ్లు నమ్మదగినట్లుగా కనిపించే, సరైన ఫార్మాట్‌ను అనుసరించే, నిజమైన పరిశోధకులను లేని పత్రాలకు కూడా జత చేసే సూచనలను ఉత్పత్తి చేయగలవని తెలిసిందే. అధిక-గతి అకాడెమిక్ వాతావరణంలో, రచయితలు లేదా ఎడిటర్లు వాటిని జాగ్రత్తగా ధృవీకరించకపోతే, ఆ లోపాలు దాటిపోవచ్చు.

సమస్య కేవలం నకిలీ సూచనలు కాదు, నమ్మదగినట్లుగా కనిపించే నకిలీ సూచనలు

అందించిన పదార్థంలో అత్యంత ఆందోళన కలిగించే విషయం, ఈ నకిలీ సూచనలను పరిశీలన ద్వారా గుర్తించడం ఎంత కష్టమో. మూల పాఠ్యంలో ఈ తప్పుడు సూచనలు తరచూ పత్రం విషయానికి సరిపోతాయి, సరైన ఫార్మాటింగ్‌ను ఉపయోగిస్తాయి, నిజమైన పరిశోధకులకు క్రెడిట్ ఇస్తాయి, మరియు నమ్మదగిన ప్రచురణ సంవత్సరాలను కూడా కలిగి ఉంటాయి. ఒక ఉదాహరణలో, ఒక యూరాలజీ పేపర్‌లో పరిశీలించిన 30 సూచనల్లో 18 నకిలీవి గా తేలాయి.

అదే ఈ సమస్యను బయోమెడికల్ ప్రచురణలో ముఖ్యంగా ప్రమాదకరంగా చేస్తుంది. స్పష్టంగా దెబ్బతిన్న సైటేషన్‌ను త్వరగా పట్టుకోవచ్చు. కానీ చక్కగా కనిపించే, అయినప్పటికీ లేకపోయిన సైటేషన్, ఎవరూ దాన్ని నమ్మదగిన డేటాబేస్‌లతో ధృవీకరించకపోతే, పీర్ రివ్యూ దాటి ప్రచురిత రికార్డులోకి వెళ్లిపోవచ్చు. అధ్యయనం నిర్వచించిన “fabricated” అనే పదం ఈ ఆందోళనను ప్రతిబింబిస్తుంది: PubMed, Crossref, OpenAlex, లేదా Google Scholar లో కనిపించని శీర్షికలను గుర్తించారు.

మూల పదార్థం ఇంకా, ఈ ప్రమాదం మరింత ప్రాముఖ్యంగా ఎక్కడ మారుతుందో కూడా స్పష్టం చేస్తుంది. సమీక్షా వ్యాసాల్లో నకిలీ సూచనలు కనిపించడం ప్రత్యేకంగా ఆందోళన కలిగిస్తుంది, ఎందుకంటే అవి తరచుగా విస్తృత పాఠకుల కోసం ఆధారాలను సంగ్రహిస్తాయి మరియు క్లినికల్ మార్గదర్శకాలను ప్రభావితం చేయగలవు. ఒక సమీక్ష పునాదిలో నకిలీ సాహిత్యం ఉంటే, దాని ప్రభావం ఒకే పత్రాన్ని మించి విస్తరించగలదు.

సూచించిన ప్రతిస్పందన మరింత ఆటోమేషన్, తక్కువ పరిశీలన కాదు

మూల పాఠ్య ప్రకారం, పరిశోధకులు ప్రచురణకు ముందే ఆటోమేటెడ్ రిఫరెన్స్ చెక్‌లు, అలాగే ఇప్పటికే ప్రచురితమైన పత్రాల రిట్రోస్పెక్టివ్ స్క్రీనింగ్ కోరుతున్నారు. ఈ సిఫార్సు ఆచరణాత్మకమైనది, ఎందుకంటే ఈ సమస్యే కొంతవరకు పరిమాణ సమస్య. లక్షలాది పత్రాలలో ప్రతి సైటేషన్‌ను మనుషులు చేతితో ధృవీకరించడం సాధ్యం కాదు, ముఖ్యంగా నకిలీ సూచనలు నిజమైనవిగా కనిపించేలా రూపొందించబడితే.

మూల పదార్థం arXiv వంటి వేదికలు AI-సంబంధిత లోపాల కోసం ప్రాథమిక శిక్షలను ఇప్పటికే ప్రవేశపెట్టాయని చెబుతుంది. ఇది కఠినమైన నిబంధనల దిశగా కదలికను సూచిస్తుంది, కానీ బయోమెడికల్ ప్రచురణకు హెచ్చరికలు మాత్రమే చాలవు. రిఫరెన్స్ ధృవీకరణ plagiarism checks లేదా image screening లాగానే, సంపాదకీయం వర్క్‌ఫ్లోలో నియమిత సాంకేతిక దశగా మారాల్సి రావచ్చు.

ఇక్కడ ఒక విస్తృత పాఠమూ ఉంది. AI సాధనాలు ముసాయిదా రాయడానికి అయ్యే ఖర్చును తగ్గించగలవు, కానీ అధికారికంగా కనిపించే అబద్ధాలను తయారు చేసే ఖర్చును కూడా తగ్గిస్తాయి. శాస్త్రీయ కమ్యూనికేషన్‌లో ఈ వ్యత్యాసం ప్రత్యేకంగా ప్రమాదకరమైనది, ఎందుకంటే పాఠకులు సైటేషన్ వ్యవస్థ ఇప్పటికే ధృవీకరించబడిందని భావిస్తారు. ఆ భావన బలహీనపడితే, సాహిత్యంపై నమ్మకం దెబ్బతింటుంది.

AI స్వీకరణ కథలో ఇప్పుడు సమగ్రత సవాలూ భాగమైంది

కొత్త ఆడిట్ ప్రకారం, బయోమెడికల్ ప్రచురణలో నకిలీ సూచనలు ఇక అంచున ఉన్న సమస్య కాదు. అవి తరచుగా రావడం మొదలై, వేగంగా పెరుగుతున్నాయి, అందువల్ల ప్రక్రియ మార్పులు అవసరం. ప్రధాన కారకం భాషా మోడల్ దుర్వినియోగమా, పేపర్-మిల్‌లా, లేదా రెండింటి కలయికా అన్నది ఒకటే; ప్రాక్టికల్ ప్రభావం ఒకేలా ఉంటుంది: అవి ప్రొఫెషనల్‌గా కనిపిస్తున్నాయన్న కారణంతోనే సూచనలను నమ్మదగినవిగా పరిగణించలేం.

ఇది ఏ రంగానికైనా గంభీర సమస్య, కానీ ముఖ్యంగా సమీక్షలు మరియు సారాంశాలు క్లినికల్ మార్గదర్శకాలను ఆకృతీకరించగల రంగానికి. మూల పదార్థం తెలిపేది AIని పరిశోధనా పనుల నుంచి పూర్తిగా తొలగించాలన్నది కాదు. కఠిన ధృవీకరణ లేకుండా AI-సహాయంతో రచన చేయడం సాక్ష్య శృంఖలిని కలుషితం చేయగలదన్నది. అది పెద్ద స్థాయిలో జరిగితే, నమ్మక నష్టాలు ఒకే పత్రం దాటి వ్యాపిస్తాయి.

2.47 మిలియన్ బయోమెడికల్ పత్రాల ఆడిట్‌లో 2,810 పత్రాల్లో 4,046 నకిలీ సూచనలు గుర్తించారు.
2023 తర్వాత నుంచి 2026 ప్రారంభం వరకు నకిలీ సూచనల రేటు 12 రెట్లు పైగా పెరిగిందని నివేదించారు.
భాషా మోడళ్లు ఒక సాద్యమైన కారణంగా గుర్తించబడ్డాయి, కానీ అవి మాత్రమే కాదు.
క్లినికల్ అవగాహన మరియు మార్గదర్శకాలను ప్రభావితం చేసే సమీక్షా వ్యాసాల్లో నకిలీ సూచనలు అత్యంత ప్రమాదకరం.
ఆయనులు ఆటోమేటెడ్ రిఫరెన్స్ చెక్‌లు మరియు రిట్రోస్పెక్టివ్ స్క్రీనింగ్‌ను సిఫార్సు చేస్తున్నారు.

ఈ వ్యాసం The Decoder నివేదికపై ఆధారపడి ఉంది. మూల వ్యాసాన్ని చదవండి.

Originally published on the-decoder.com

నకిలీ AI సూచనలు బయోమెడికల్ సాహిత్యంలోకి వ్యాపిస్తున్నాయి

ప్రచురణ సమగ్రత సమస్య ఇప్పుడు పెద్ద స్థాయిలో కొలవదగినదిగా మారింది

కాలక్రమం AI అనుమానాన్ని బలపరుస్తుంది, కానీ ఒక్కదానితోనే నిరూపించదు

సమస్య కేవలం నకిలీ సూచనలు కాదు, నమ్మదగినట్లుగా కనిపించే నకిలీ సూచనలు

సూచించిన ప్రతిస్పందన మరింత ఆటోమేషన్, తక్కువ పరిశీలన కాదు

AI స్వీకరణ కథలో ఇప్పుడు సమగ్రత సవాలూ భాగమైంది

Comments (0)

Keep Reading