హార్వర్డ్ అధ్యయనం: OpenAI మోడల్ ప్రారంభ ER నిర్ధారణలో వైద్యులను మించింది

ప్రమాదం అత్యధికంగా ఉన్నప్పుడు AI అత్యుత్తమ ప్రదర్శన చూపింది

ఈ వారం Scienceలో ప్రచురితమైన హార్వర్డ్-నేతృత్వంలోని అధ్యయనం, వైద్యంలో కృత్రిమ మేధస్సు ఎలా ఉపయోగపడవచ్చో అనే చర్చకు ఒక కీలకమైన డేటా పాయింట్‌ను జోడించింది. పేపర్‌లో అత్యంత ఆసక్తిగా పరిశీలించిన ప్రయోగాలలో ఒకటిలో, పరిశోధకులు Beth Israel Deaconess Medical Centerలోని నిజమైన అత్యవసర గది కేసులపై OpenAI మోడళ్ల నిర్ధారణలను రెండు అంతర్గత వైద్య అటెండింగ్ వైద్యుల నిర్ధారణలతో పోల్చారు. అధ్యయనం ప్రకారం, OpenAI యొక్క o1 మోడల్ ప్రతి నిర్ధారణ దశలో మానవ వైద్యులకు సమానంగా లేదా వారికంటే మెరుగ్గా పని చేసింది; ప్రారంభ ER ట్రయాజ్‌లో అత్యంత స్పష్టమైన ఆధిక్యం కనిపించింది.

ఇది ముఖ్యమైనది, ఎందుకంటే ట్రయాజ్‌లో వైద్యులకు అత్యల్ప సమాచారం మరియు అత్యల్ప సమయం మాత్రమే ఉంటుంది. రోగి పరిస్థితికి అత్యంత సంభావ్యమైన కారణాన్ని మరింత విస్తృత పరీక్షలు అందుబాటులోకి రాకముందే గుర్తించడానికి వైద్యులు మరియు ఆసుపత్రులు ప్రయత్నించే మొదటి టచ్‌పాయింట్‌లోనే తేడాలు ప్రత్యేకంగా ఎక్కువగా కనిపించాయని అధ్యయనం తెలిపింది. ఆ ప్రారంభ దశలో, o1 67% కేసుల్లో ఖచ్చితమైన లేదా చాలా దగ్గరైన నిర్ధారణను ఇచ్చిందని, ఒక అటెండింగ్ వైద్యుడికి 55% మరియు మరొకరికి 50% మాత్రమే వచ్చాయని పరిశోధకులు నివేదించారు.

ఈ పోలికను ఎలా రూపొందించారు

ఈ పరిశోధనా బృందానికి Harvard Medical School మరియు Beth Israel Deaconessలోని వైద్యులు మరియు కంప్యూటర్ శాస్త్రవేత్తలు నాయకత్వం వహించారు. మూల పదార్థంలో హైలైట్ చేసిన అత్యవసర గది ప్రయోగంలో, బృందం Beth Israel ERకి వచ్చిన 76 రోగులపై దృష్టి సారించింది. రెండు OpenAI మోడళ్లు, o1 మరియు 4o, రూపొందించిన నిర్ధారణలను రెండు అంతర్గత వైద్య అటెండింగ్ వైద్యుల నిర్ధారణలతో తూచారు.

ఆ ఫలితాలను, ఏ నిర్ధారణలు మనుషుల నుంచి వచ్చాయో ఏవి AI వ్యవస్థల నుంచి వచ్చాయో తెలియని మరో ఇద్దరు అటెండింగ్ వైద్యులు సమీక్షించారు. ఈ బ్లైండింగ్ ముఖ్యమైనది, ఎందుకంటే అంచనాల ఆధారంగా కాకుండా నాణ్యత ఆధారంగా సమీక్షకులు ఒక మూలానికి మరొకదానిపై మొగ్గు చూపే ప్రమాదాన్ని ఇది తగ్గిస్తుంది.

మోడళ్లకు డేటా ఇవ్వడానికి ముందు రోగి సమాచారాన్ని ముందస్తుగా ప్రాసెస్ చేయలేదని పరిశోధకులు కూడా స్పష్టం చేశారు. బదులుగా, ప్రతి నిర్ధారణ జరిగే సమయానికి ఎలక్ట్రానిక్ మెడికల్ రికార్డులో అందుబాటులో ఉన్న అదే సమాచారం AI వ్యవస్థలకు అందింది. ఇది AI వైద్య పరిశోధనలో తరచుగా వినిపించే విమర్శను నేరుగా తాకుతుంది: శుభ్రపరచిన, సరళీకృత, లేదా అసాధారణంగా పూర్తి ఇన్‌పుట్‌లు ఇచ్చినప్పుడు మాత్రమే మోడళ్లు ఆకట్టుకునేలా కనిపించవచ్చని. ఇక్కడ, మోడళ్లను వాస్తవ ప్రాక్టీస్‌లో అందుబాటులో ఉండే అదే ముడి, అపూర్ణమైన క్లినికల్ చిత్రంపై పరీక్షించారని పరిశోధనా బృందం చెప్పింది.

Two drones, one yellow, one grey, almost identical otherwise.

FCC moves toward retroactive ban on suspected DJI front companies

The U.S. communications regulator is preparing to use a new enforcement tool against companies it says disguised DJI products to keep them on the American market.

Read article

ఫలితాలు ఏమి చెబుతున్నాయి, ఏమి చెప్పడం లేదు

శీర్షిక ఫలితం గమనించదగ్గదే, కానీ దాన్ని జాగ్రత్తగా అర్థం చేసుకోవాలి. మూల పదార్థం నిర్ధారణ పనితీరు పై అధ్యయనాన్ని వివరిస్తోంది, వైద్యులను భర్తీ చేసే పరీక్షను కాదు. ట్రయాజ్‌లో మరింత ఖచ్చితమైన నిర్ధారణ సూచన ఇవ్వడం అంటే స్వతంత్రంగా రోగి సంరక్షణను నిర్వహించడం, ప్రమాదాన్ని తెలియజేయడం, చికిత్సను ఆదేశించడం, లేదా ఫలితాలకు బాధ్యత వహించడం అన్నమాట కాదు. అత్యవసర వైద్యం ఇవన్నింటిపైనా ఆధారపడి ఉంటుంది, మరియు TechCrunch నివేదిక ఈ అధ్యయనం వైద్యులు భర్తీకి సిద్ధంగా ఉన్నారని ఎక్కడా చెప్పలేదని స్పష్టంగా పేర్కొంది.

అయినప్పటికీ, సమాచారం తక్కువగా ఉన్న మరియు సమయ ఒత్తిడి తీవ్రంగా ఉన్న క్షణాల్లో పెద్ద భాషా మోడళ్లు ఎంతో ఉపయోగకరమైన నిర్ణయ-మద్దతు సాధనాలుగా మారగలవని వాదనకు ఈ అధ్యయనం బలం ఇస్తుంది. ఒక మోడల్ ముందుగానే నిర్ధారణ పరిధిని సంకుచితం చేయడంలో సహాయపడితే, అది వేగవంతమైన ఎస్కలేషన్, పరీక్షలు, లేదా నిపుణుల భాగస్వామ్యాన్ని మెరుగుపరచవచ్చు. తీవ్ర మానసిక భారంతో పనిచేస్తున్న వైద్యులకు తప్పిపోయే అవకాశాలను తనిఖీ చేసే రక్షణగానూ ఇది పని చేయవచ్చు.

Harvard Medical Schoolకి చెందిన అధ్యయన ప్రధాన రచయితలలో ఒకరైన Arjun Manrai, పాఠశాల ప్రెస్ విడుదలలో బృందం AIని విస్తృత బెంచ్‌మార్క్‌లపై పరీక్షించిందని, అది ముందు మోడళ్లను మరియు పేపర్‌లో ఉపయోగించిన వైద్య బేస్‌లైన్‌లను మించిందని చెప్పారు. అందించిన మూల పాఠ్య పరిమితుల్లో, ఇది పరిశోధకుల స్వీయ వ్యాఖ్యానంలో అత్యంత స్పష్టమైన ప్రకటన: AI పోటీ పడిందనే కాదు, ఈ అధ్యయన రూపకల్పనలో ఒక మోడల్ కొత్త అంతర్గత ప్రమాణాన్ని నెలకొల్పిందని.

ట్రయాజ్ ఎందుకు కీలక యుద్ధభూమి

ట్రయాజ్ AI వ్యవస్థలకు అసాధారణంగా వెలుగు చూపించే వాతావరణం, ఎందుకంటే అది అనిశ్చితిని కుదిస్తుంది. వైద్యుడికి తరచుగా ఒక చిన్న నోట్, తొలి లక్షణాల సమాహారం, మరియు ఏమి తప్పక గుర్తించాలో నిర్ణయించాల్సిన అవసరం ఉంటుంది. అదే రకమైన సమాచార నమూనాపై పెద్ద భాషా మోడళ్లు పని చేయడానికి నిర్మించబడ్డాయి: విభజిత పాఠ్యం, భాగస్వామ్య సందర్భం, మరియు అవకాశాలను వేగంగా క్రమబద్ధం చేయాల్సిన అవసరం.

ఈ అధ్యయన ఫలితం, ఇది ముఖ్యంగా అధునాతన మోడళ్లకు అనుకూలమైన వినియోగ సందర్భం కావచ్చని సూచిస్తుంది. రికార్డు ఎంత తక్కువ పూర్తిగా ఉంటే, అతి సంభావ్యమైన లేదా అత్యంత ప్రమాదకరమైన వివరణలను స్థిరంగా గుర్తించగలిగితే, వ్యవస్థ అంత విలువైనదిగా మారుతుంది. మొదటి టచ్‌పాయింట్‌లోనే వ్యత్యాసం అత్యధికంగా ఉండటం, పూర్తి రికార్డులు, ఇమేజింగ్, మరియు ల్యాబ్ పనులు అందుబాటులోకి వచ్చిన తర్వాత మాత్రమే కాక, సంరక్షణకు ముందుభాగంలో AI మద్దతు అత్యంత ఉపయోగకరమని సూచిస్తుంది.

అది జాగ్రత్త అవసరాన్ని తొలగించదు. క్లినికల్ డిప్లాయ్‌మెంట్‌లో ఇంకా వివిధ ఆసుపత్రుల్లో ధృవీకరణ, వైద్యుల పర్యవేక్షణ, వర్క్‌ఫ్లో సమీకరణ, మరియు మోడల్ సూచనలు తప్పుగా, అసంపూర్ణంగా, లేదా అతిగా నమ్మకంగా ఉన్నప్పుడు ఏమి జరుగుతుందో వంటి ప్రశ్నలు ఉంటాయి. ఒకే అధ్యయనం, అది ఎంత ఉన్నత స్థాయి అయినా, ఈ సమస్యలను పరిష్కరించదు.

$A fractured image of a person speaking into a microphone.$

Sony expands Udio fight with new lawsuit over 30,000 songs

Sony Music has filed a new lawsuit accusing Udio of infringing more than 30,000 songs, escalating one of the most consequential copyright fights around generative AI music.

Read article

తదుపరి ఏమిటి

ఈ పత్రం తక్షణ ప్రాధాన్యం ఏమిటంటే, ఆసుపత్రులు, నియంత్రణ సంస్థలు, మరియు ఆరోగ్య-వ్యవస్థ నాయకులకు అత్యాధునిక భాషా మోడళ్లు క్లినికల్ పరిసరాల్లో సీరియస్ మూల్యాంకనానికి అర్హమని చూపించే బలమైన ఆధారాన్ని ఇస్తుంది. సమీప భవిష్యత్‌లో అత్యంత వాస్తవిక దారి స్వయంచాలక నిర్ధారణ కాదు, కానీ ఇప్పటికే ఉన్న సంరక్షణ బృందాల్లో పర్యవేక్షిత వినియోగం.

మరిన్ని అధ్యయనాలు విస్తృత రోగి సమూహాలు మరియు సంస్థల్లో ఇలాంటి పనితీరును ధృవీకరిస్తే, ఆసుపత్రులు AI ట్రయాజ్ సహాయాన్ని ప్రయోగాత్మక కొత్తదనంగా కాకుండా, నిర్ధారణ మద్దతుకు వాస్తవిక పొరగా పరిగణించడం ప్రారంభించవచ్చు. దానికి సిబ్బంది, వైద్య శిక్షణ, బాధ్యతా ఫ్రేమ్‌వర్కులు, మరియు ఎలక్ట్రానిక్-రికార్డ్ సాఫ్ట్‌వేర్ డిజైన్‌పై ప్రభావాలు ఉంటాయి.

ప్రస్తుతం, ఈ అధ్యయనం చర్చను ఊహాజనిత వాగ్దానంనుంచి నిజమైన అత్యవసర గది కేసుల్లో కొలిచిన పోలిక వైపు తీసుకెళ్తుంది కాబట్టి ప్రత్యేకంగా కనిపిస్తోంది. వైద్యంలో, అది ఒక అర్థవంతమైన మైలురాయి. ప్రశ్న ఇప్పుడు AI విశ్వసనీయమైన క్లినికల్ భాషను ఉత్పత్తి చేయగలదా అన్నది కాదు. కొన్ని సందర్భాల్లో అనుభవజ్ఞులైన వైద్యులకంటే ముందే సరైన నిర్ధారణను గుర్తించగల సాధనాలను ఆరోగ్య వ్యవస్థలు బాధ్యతతో ఉపయోగించడానికి సిద్ధంగా ఉన్నాయా అన్నదే ప్రశ్న.

ఈ వ్యాసం TechCrunch నివేదిక ఆధారంగా ఉంది. మూల వ్యాసాన్ని చదవండి.

Originally published on techcrunch.com

హార్వర్డ్ నేతృత్వంలోని అధ్యయనం: ఒక OpenAI మోడల్ ప్రారంభ ER నిర్ధారణలో వైద్యులను మించిపోయింది

ప్రమాదం అత్యధికంగా ఉన్నప్పుడు AI అత్యుత్తమ ప్రదర్శన చూపింది

ఈ పోలికను ఎలా రూపొందించారు

FCC moves toward retroactive ban on suspected DJI front companies

ఫలితాలు ఏమి చెబుతున్నాయి, ఏమి చెప్పడం లేదు

ట్రయాజ్ ఎందుకు కీలక యుద్ధభూమి

Sony expands Udio fight with new lawsuit over 30,000 songs

తదుపరి ఏమిటి

Comments (0)

Related Articles

Apple Maps Ads Will Exclude Home Services

France orders ISPs to block Polymarket access

Truth Social to sell real-time API access to top accounts

OMB Grant Proposal Draws Fierce Backlash From Space Science Advocates

Joolca Hottap Go Review: A $700 Portable Shower for the Adventurous

Keep Reading