ChatGPT Health triage అధ్యయనం అత్యవసర సలహాలో భద్రతా లోపాలను గుర్తించింది

AI triage మధ్యలో ఉత్తమం, అంచుల్లో కాదు

Nature Medicineలో వచ్చిన కొత్త సంక్షిప్త నివేదిక, వినియోగదారుల AI యొక్క అత్యంత సున్నితమైన ఉపయోగాల్లో ఒకటైన, వారికి వైద్య సంరక్షణ ఎంత త్వరగా అవసరమో చెప్పే విషయంలో, మరింత స్పష్టమైన హెచ్చరికను జోడిస్తోంది. నివేదిక ప్రకారం, ChatGPT Health మధ్యస్థ అత్యవసరత ఉన్న పరిస్థితులలో అధిక ఖచ్చితత్వాన్ని చూపింది, కానీ క్లినికల్ స్పెక్ట్రమ్ యొక్క రెండు అంచులలో తరచుగా తప్పుగా నిర్ణయించింది. తేలికపాటి కేసులను అవి నిజంగా ఉన్నదానికంటే ఎక్కువ అత్యవసరంగా పరిగణించబడగా, నిజమైన అత్యవసర పరిస్థితులను కొన్నిసార్లు చాలా తక్కువగా ర్యాంక్ చేశారు.

ఈ నమూనా ముఖ్యం, ఎందుకంటే triage కేవలం జ్ఞాన వ్యాయామం కాదు. ఇది ప్రజలు తదుపరి ఏమి చేస్తారో ప్రభావితం చేసే ఒక నిర్ణయ వ్యవస్థ. ఒక సాధనం చిన్న సమస్య ఉన్న వ్యక్తికి అత్యవసర సంరక్షణ తీసుకోవాలని చెప్పితే, దాని ఫలితం ఆందోళన, అనవసర ఖర్చు, మరియు ఇప్పటికే ఒత్తిడిలో ఉన్న క్లినిక్లు, అత్యవసర విభాగాలపై మరింత భారం కావచ్చు. కానీ అదే వ్యవస్థ ప్రమాదకరమైన పరిస్థితి ఉన్న వ్యక్తికి వారి లక్షణాలు అత్యవసరం కావని చెబితే, ఫలితాలు మరింత తీవ్రమైనవిగా ఉండొచ్చు.

ఈ కొత్త నివేదిక ఆ తప్పులను ఇంకా పరిపక్వం చెందని సాంకేతికతలోని చిన్న విచిత్రాలుగా కాకుండా, భద్రతా ప్రమాదాలుగా రూపకల్పన చేస్తోంది. ఆ తేడా ముఖ్యమైనది. పెద్ద భాషా నమూనాలు తరచుగా వాటి fluency, knowledge breadth ఆధారంగా అంచనా వేయబడతాయి, కానీ triage కు మరింత సంకుచితమైన, కఠినమైన విషయం కావాలి: అనిశ్చితి మధ్య స్థిరమైన క్లినికల్ ప్రాధాన్యత. నివేదిక ప్రకారం, ChatGPT Health మధ్యస్థ అత్యవసర కేసుల్లో బాగా పనిచేయగలదేమో, కానీ అత్యంత సురక్షిత సమాధానం అత్యంత అవసరమైనప్పుడు అంత విశ్వసనీయంగా ఉండకపోవచ్చు.

సగటు కంటే అంచులు ఎందుకు ముఖ్యమైనవి

హెడ్‌లైన్ స్థాయి ఖచ్చితత్వం ప్రమాదకరమైన వైఫల్య విధానాలను దాచివేయగలదు. అనేక సాధారణ లేదా మధ్యస్థ అత్యవసర పరిస్థితుల్లో బాగా పనిచేసే మోడల్, అరుదైన అత్యవసర పరిస్థితులు లేదా self-care మరియు తక్షణ జోక్యం మధ్య తేడాను గుర్తించడంలో ఇబ్బంది పడితే, అది ఇంకా అసురక్షితంగా ఉండవచ్చు. వాస్తవ వినియోగంలో, ఆ క్షణాల్లోనే రోగులు మార్గదర్శకత్వం కోసం ఒక సాధనంపై ఎక్కువగా ఆధారపడతారు.

నివేదిక సారాంశం రెండు విరుద్ధమైన కానీ సమానంగా కీలకమైన ప్రవణతలను సూచిస్తోంది. ఒకటి, అత్యవసరం కాని పరిస్థితులను ఎక్కువగా అత్యవసరంగా అంచనా వేయడం. ఇది వ్యవస్థను జాగ్రత్తగా కనిపించేలా చేయవచ్చు, కానీ అతిగా జాగ్రత్తగా ఉండటం ఉచితం కాదు. ఇది సంరక్షణ-అన్వేషణ ప్రవర్తనను వక్రీకరించగలదు, మరింత మందిని అనవసరంగా అత్యవసర విభాగాల వైపు నడిపించగలదు, మరియు వినియోగదారులు దానిని తరచుగా అలార్మిస్టిక్‌గా భావిస్తే నమ్మకాన్ని తగ్గించగలదు.

మరొక ప్రవణత అత్యవసర పరిస్థితులను తక్కువగా అంచనా వేయడం, ఇది మరింత తీవ్రమైన ఆందోళన. సమయానికి సున్నితమైన పరిస్థితిని మిస్ కావడం అనేది triage రూపకల్పనలో ఆరోగ్య వ్యవస్థలు తప్పించేందుకు ప్రయత్నించే ప్రధాన వైఫల్యం. అత్యవసరాలను తక్కువగా అంచనా వేసే సాధనం ఉపరితలంగా సమర్థవంతంగా లేదా ప్రశాంతంగా కనిపించవచ్చు, కానీ అధిక-ప్రమాద వాతావరణాలలో సమర్థించడానికి కష్టమైన ప్రమాదాన్ని కలిగి ఉంటుంది.

ఒకే మూల్యాంకనంలో రెండు రకాల తప్పులు కనిపించడం బహిర్గతంగా సూచనాత్మకం. ఇది మోడల్ కేవలం జాగ్రత్తగా ఉన్నదీ కాదు, కేవలం నిర్లక్ష్యంగా ఉన్నదీ కాదు అని సూచిస్తోంది. బదులుగా, విభిన్న పరిస్థితుల్లో క్లినికల్ అత్యవసరతపై స్థిరమైన అంతర్గత భావం దానిలో లేకపోవచ్చని అర్థం. ఇది లోతైన నమ్మక సమస్య, ఎందుకంటే వ్యవస్థ ఎల్లప్పుడూ ఒకే వైపు తప్పు చేస్తుందని ఊహించి దాన్ని సరిచేయలేం.

New mechanism explains how spinal stimulation improves arm movement after stroke

స్ట్రోక్ తర్వాత మరింత సున్నితమైన భుజం కదలికను స్పైనల్ కార్డ్ స్టిమ్యులేషన్ ఎలా పునరుద్ధరించవచ్చు

ఎదురెదురు కండరాలు సమన్వయంగా పనిచేయడానికి సహాయపడే నిరోధక స్పైనల్ సర్క్యూట్లను పునరుద్ధరించడం ద్వారా ఎపిడ్యూరల్ స్పైనల్ కార్డ్ స్టిమ్యులేషన్ స్ట్రోక్ తర్వాత చేతి నియంత్రణను మెరుగుపరచవచ్చని కార్నెగీ మెలోన్ పరిశోధకులు నివేదించారు.

Read article

AI-in-health చర్చకు ఈ ఫలితాలు ఏమి జోడిస్తున్నాయి

సాధారణ-ప్రయోజన భాషా నమూనాలు రోగి-ముఖీ వైద్య నిర్ణయాలకు సురక్షితంగా సహాయపడగలవా అనే విస్తృత చర్చలో ఈ సారాంశం చోటుచేసుకుంది. ఈ సాధనాలపై ఆసక్తి వేగంగా పెరిగింది, ఎందుకంటే అవి అందుబాటులో ఉండేవి, సంభాషణాత్మకమైనవి, మరియు తరచుగా నమ్మదగినవిగా ఉంటాయి. అవి లక్షణాలను సంగ్రహించగలవు, సంభావ్య పరిస్థితులను వివరించగలవు, మరియు వ్యక్తిగతంగా, నమ్మకంగా అనిపించే స్వరంలో సలహాను ఉత్పత్తి చేయగలవు.

కానీ నమ్మదగినదిగా అనిపించడం అంటే ఖచ్చితత్వం కాదు, మరియు నమ్మకం అంటే calibration కూడా కాదు. నివేదికలో సూచించిన పూర్వ అధ్యయనాలు, AI-ఉత్పత్తి చేసిన వైద్య సలహా తప్పు అయినప్పటికీ ప్రజలు దానిని అతిగా విశ్వసించవచ్చని ఇప్పటికే ఆందోళన వ్యక్తం చేశాయి. ఇతర ఉల్లేఖిత అధ్యయనాలు క్లినికల్ నిర్ణయాల్లో ఉన్న బలహీనతలను నమోదు చేసి, అమలుకు ముందు కఠినమైన బాహ్య ధృవీకరణను కోరాయి.

ఈ కొత్త నివేదిక AI కి triage లో ఎలాంటి పాత్రలేదని చెప్పడం లేదు. బదులుగా, బలమైన భద్రతా క్లెయిమ్‌లు చేయగల పరిధిని ఇది తగ్గిస్తుంది. పనితీరు మధ్యస్థ అత్యవసర కేసుల్లో బలంగా, కానీ స్కేల్ యొక్క రెండు అంచుల్లో అస్థిరంగా ఉంటే, విస్తృత వినియోగదారుల స్థానం రక్షించటం కష్టం. సాధారణ, అస్పష్ట ఫిర్యాదులకు ఉపయోగకరమైన triage సహాయకుడు, వినియోగదారులు ఎప్పుడు దాన్ని నమ్మకూడదో తెలియకపోతే ఇంకా అసురక్షితంగా ఉండవచ్చు.

అత్యవసర సంరక్షణలో ఈ సవాలు మరింత పెరుగుతుంది, ఎందుకంటే వినియోగదారు తరచుగా ఒత్తిడిలో, నొప్పిలో, లేదా మరొకరి కోసం నిర్ణయం తీసుకుంటూ ఉంటారు. ఆ క్షణాల్లో సూక్ష్మత చర్యగా మారిపోతుంది. వేచి ఉండండి, లక్షణాలను గమనించండి, లేదా అత్యవసర సంరక్షణ తీసుకోండి అనే సిఫార్సు నేపథ్య సమాచారంలా చదవబడదు. అది దిశానిర్దేశంగా పరిగణించబడుతుంది.

డెవలపర్లు, క్లినీషియన్లు, మరియు నియంత్రకులపై ప్రభావాలు

డెవలపర్లకు, ప్రభావం సూటిగా ఉంటుంది: ఆరోగ్య triage ని సాధారణ chatbot ఫీచర్‌లా అంచనా వేయలేము. దీనికి ఎడ్జ్ కేసులు, అరుదైన అత్యవసరాలు, మరియు తరచుగా అనవసర ఎస్కలేషన్‌కు దారితీసే తక్కువ-తీవ్రత ఫిర్యాదులపై లక్ష్యిత పరీక్ష అవసరం. సమగ్ర స్కోర్లు సరిపోవు. భద్రత వ్యవస్థ ఎక్కడ విఫలమవుతుందో దానిపై ఆధారపడుతుంది, కేవలం ఎంతసార్లు విఫలమవుతుందో దానిపై కాదు.

క్లినీషియన్లు మరియు ఆరోగ్య సంస్థలకు, ఈ ఫలితాలు రోగి-ముఖీ AI సాధనాలను front-door guidance systems గా స్వీకరించడంలో జాగ్రత్త అవసరమని మళ్లీ రుజువు చేస్తున్నాయి. ఇటువంటి సాధనాలు సమాచారం ప్రాప్తిని మెరుగుపరచగలిగినా, వాటి అవుట్‌పుట్‌కు ఇంకా guardrails, స్పష్టమైన disclaimers, మరియు జాగ్రత్తగా రూపొందించిన escalation మార్గాలు అవసరం కావచ్చు. అనేక పరిస్థితుల్లో సహాయకరంగా కనిపించే మోడల్ కూడా, వినియోగదారులు దానిని వైద్యపరంగా నమ్మదగినదిగా భావిస్తే ప్రమాదం సృష్టించగలదు.

నియంత్రకులు మరియు విధాననిర్ణేతలకు, ఈ నివేదిక symptom checkers మరియు clinical decision aids లాగా పనిచేసే generative AI ఉత్పత్తులపై కఠిన పరిశీలనకు కేసును బలపరుస్తుంది. ఇక్కడ ప్రధాన సమస్య సాఫ్ట్‌వేర్ పెద్ద భాషా నమూనాను వాడుతోందా లేదా వేరే architecture వాడుతోందా అన్నది కాదు. దాని risk profile నిజమైన పరిస్థితుల్లో నిరూపించబడిందా అన్నదే అసలు విషయం.

పెద్ద పాఠం ఏమిటంటే, వైద్యం సంభాషణాత్మక మేధస్సు మరియు నిర్ణయ విశ్వసనీయత మధ్య ఉన్న ఖాళీని బయటపెడుతుంది. ChatGPT Health ఉపయోగకరంగా అనిపించడంలో బాగా ఉండవచ్చు, కొన్ని సందర్భాల్లో నిజంగానే ఉపయోగకరంగా కూడా ఉండవచ్చు. కానీ ఈ మూల్యాంకనం సూచించేదేమిటంటే, అత్యవసరత ప్రశ్నగా ఉన్నప్పుడు, తప్పులు అంగీకారయోగ్యం కాని చోటే ఈ సాధనం ఎక్కువగా ఇబ్బంది పడుతోంది.

అది సంరక్షణ మార్గనిర్దేశంలో AI కి ద్వారం మూసివేయదు. అయితే, ఇది మరింత సంకుచితమైన మరియు ఆధార-ఆధారిత పాత్ర కోసం వాదిస్తుంది. అత్యవసర పరిస్థితులతో సహా పూర్తి అత్యవసరత స్పెక్ట్రంలో ఈ తరహా సాధనాలు నమ్మదగిన పనితీరును చూపే వరకు, వాటిని విశ్వసనీయ triage అధికారులుగా కాకుండా సమాచార సహాయకాలుగానే పరిగణించడం మంచిది.

ఈ వ్యాసం Nature Medicine నివేదిక ఆధారంగా ఉంది. మూల వ్యాసాన్ని చదవండి.

GLP-1 shows promise for patients with advanced fatty liver disease

అధునాతన MASH ట్రయల్‌లో సెమాగ్లుటైడ్ ఫైబ్రోసిస్‌-నిరోధక సంకేతాన్ని చూపింది

ఒక పెద్ద అంతర్జాతీయ ఫేజ్ 2 ట్రయల్‌లో, ప్రారంభ సిర్రోసిస్ సహా అధునాతన MASH ఉన్న రోగుల్లో, వాపును మరింత చెడగొట్టకుండా సెమాగ్లుటైడ్ కాలేయ మచ్చలను మెరుగుపరిచిందని తేలింది.

Read article

Originally published on nature.com