ఒక చిన్న PDF సమస్య, ప్రజలు AIను ఎలా నమ్మవచ్చో పరీక్షించే ఉపయోగకరమైన ఉదాహరణగా మారింది
ఈ వారంలోని మరింత స్థిరంగా ఉన్న AI కథల్లో ఒకటి ఉత్పత్తి విడుదల నుంచీ లేదా బెంచ్మార్క్ చార్ట్ నుంచీ రాలేదు. అది ఒక ఇంటి వర్క్ఫ్లో సమస్య నుంచే వచ్చింది. ZDNET కోసం జూన్ 5న వచ్చిన ఒక కథనంలో, డేవిడ్ గెవర్ట్జ్ ఒక డాక్యుమెంట్ను నేరుగా మార్చడానికి ChatGPTను వాడకుండా, ఆ పనిని deterministic విధంగా చేయగల command-line Python scriptను రాయించుకున్నట్లు వివరించారు. లక్ష్యం పసుపు కాగితంపై ముద్రించిన, స్కాన్ చేసిన ఒక choir booklet. పేజీలను మరింత చదవదగ్గగా తిరిగి ముద్రించడానికి, అలాగే సంగీత సాఫ్ట్వేర్లో మరింత సమర్థంగా ఉపయోగించడానికి పసుపు నేపథ్యాన్ని తొలగించడం ఉద్దేశం.
ఈ కథను గమనించదగ్గదిగా 만드는ది PDF శుభ్రపరిచే పని కాదు. పరిష్కారానికి దారితీసిన ఆలోచన. ChatGPT తయారు చేసిన PDFsతో నేరుగా చేసిన ప్రయోగాలు పనిచేశాయి, కానీ అవి నమ్మకం సంబంధిత సమస్యను తెచ్చాయి. ఒక generative మోడల్ sheet musicను తాకితే, అది notes, lyrics లేదా layoutను సూక్ష్మంగా మార్చే అవకాశం ఉందా? సాధారణ textకు ఆ ప్రమాదం సహించదగ్గదిగా ఉండవచ్చు. సంగీత సాధనానికి కాదు.
అందుకే, మోడల్ను editorగా అడగడం బదులు, కుటుంబం దాన్ని toolmakerగా అడిగింది.
జెనరేటివ్ అవుట్పుట్ నుంచి deterministic workflow వరకు
ఈ మార్పు వాస్తవ పరిస్థితుల్లో AI అత్యంత సమర్థంగా ఎలా ఉపయోగించబడుతుందో గురించి పెద్ద పాఠాన్ని చూపుతుంది. Generative systems శక్తివంతమైనవి, కానీ అవి non-deterministic కూడా, అంటే అవుట్పుట్లు మారవచ్చు మరియు ఉద్దేశించని మార్పులను చేర్చవచ్చు. మూలానికి fidelity ముఖ్యమైనప్పుడు, ఆ అంచనాకు రాని స్వభావం నమ్మకానికి అడ్డుగా మారుతుంది.
గెవర్ట్జ్ ఈ తేడాను స్పష్టంగా వివరించారు. ChatGPT చేసిన నేర PDF మార్పులు తుది ఫైళ్లను సున్నితమైన మార్గాల్లో మార్చాయని, దాంతో ఆయన భార్య వాటితో సాధన చేయడం పట్ల అసౌకర్యంగా ఉన్నారని ఆయన చెబుతారు. సంగీత విషయాన్ని అలాగే ఉంచుతూ, కేవలం నేపథ్యాన్ని మాత్రమే మార్చే ప్రక్రియను ఆమె కోరుకున్నారు.
దీనికి ప్రత్యామ్నాయం ChatGPTతో ఒక నిర్దిష్ట మార్పును నిర్వహించే software రాయించడం. ఒకసారి తయారైన తర్వాత, ఎవరో codeను మార్చితే తప్ప script ప్రతి సారి అదే విధంగా పని చేస్తుంది. ఇది పనిని probabilistic generation నుంచి procedural executionకు మారుస్తుంది. అనేక ప్రాయోగిక రంగాల్లో, అదే “interesting demo” మరియు “usable tool” మధ్య తేడా.
తక్షణ ఉపయోగం సాధారణమైనదే, అదే ముఖ్యమైన విషయం
స్కాన్ చేసిన choir పేజీలు పసుపు stockపై ముద్రించబడ్డాయి. అవి అలాగే మళ్లీ ముద్రిస్తే, చాలా color ink ఖర్చవుతుంది లేదా black-and-white outputలో gray background మిగులుతుంది. ఆ పేజీలు PlayScore 2తో కూడా పనిచేయాలి, ఇది ఒక music-reading app, కాబట్టి visual clarity మనుషులు, యంత్రం రెండింటికీ ముఖ్యమైంది.
మొదట Photoshopను పరిగణించారు, కానీ ప్రతి imageకు వేర్వేరు slider adjustments అవసరం కావడం వల్ల manual process చాలా చిక్కుగా ఉండిందని article చెబుతోంది. ఇది AIకు సమీపమైన మరో పరిచిత pattern. సాంప్రదాయ software సమస్యను పరిష్కరించగలదు, కానీ సాధారణ వినియోగానికి శ్రమ ఖర్చు చాలా ఎక్కువ. AIను సరిగ్గా వాడితే, ఖచ్చితమైన ఆ పనికి సరిపోయే custom utility రూపొందించి setup భారం తగ్గించవచ్చు.
ఫలితంగా వచ్చినది ఆకర్షణీయమైన consumer application కాదు. అది చిన్న ప్రయోజనానికి చెందిన command-line Python tool. కానీ ఇదే ఉదాహరణను ముఖ్యంగా చేస్తుంది. AI యొక్క నిజమైన ఆర్థిక విలువలో పెద్ద భాగం, నిన్న లేని, అత్యంత నిర్దిష్టమైన, సాధారణంగా కనిపించే software నుంచే రావచ్చు; ఎందుకంటే దాన్ని రాయడానికి ఆ పనికన్నా ఎక్కువ సమయం పట్టేది.
నమ్మకం నమూనా మారుతోంది
AI గురించి కథలు సాధారణంగా మోడళ్లకు నేరుగా ఏమి చేయగలవో దానిపై దృష్టి పెడతాయి: వ్రాయడం, సంగ్రహించడం, గీయడం, code రాయడం లేదా filesను స్వయంగా నిర్వహించడం. ఈ ఉదాహరణ వేరే నమ్మకం నమూనా వైపు చూపిస్తోంది. వినియోగదారులు AI ఒక విధానాన్ని ప్రతిపాదించడం లేదా code తయారు చేయడాన్ని స్వీకరించవచ్చు, అయితే విలువైన మూల పదార్థంపై తుది మార్పు కోసం పారదర్శకమైన, తిరిగి చేయగల toolను ఇష్టపడవచ్చు.
ఈ తేడా సంస్థలకు మాత్రమే కాక, ఇళ్లకు కూడా ముఖ్యమైనది. చట్ట, వైద్య, ఆర్థిక మరియు ఆర్కైవ్ సందర్భాల్లో ప్రశ్న AI ఒక పనిని చేయగలదా అన్నది కాదు. వ్యవస్థ ట్రేసబిలిటీతో, మధ్యలో అనధికార మార్పులు చేర్చబడలేదని నమ్మేంత నమ్మకంతో చేయగలదా అన్నదే.
ఫలితంగా, అత్యంత ప్రాయోగిక AI workflow తరచుగా రెండు దశలుగా ఉండవచ్చు. మొదట, software creationను వేగవంతం చేయడానికి మోడల్ను వాడండి. తర్వాత, తయారైన deterministic processను ఆధార filesపై నడపండి. ఇది codeను పరిశీలించడం లేదా outputను ధృవీకరించడం అవసరాన్ని తొలగించదు, కానీ uncertaintyను తగ్గిస్తుంది.
ఇది ఇంకో AI trick కంటే ఎందుకు ఎక్కువ
ఈ anecdoteను ఒక తెలివైన life hackగా చదివేసి ముందుకు వెళ్లాలనే ప్రలోభం ఉంటుంది. కానీ ఇది వాస్తవానికి generative AI adoption curveలోని కేంద్ర సమస్యను తాకుతుంది: ప్రజలకు కేవలం సామర్థ్యం మాత్రమే అవసరం కాదు. వారికి controllability కావాలి.
choir booklet ఉదాహరణ అసాధారణంగా స్పష్టమైనది, ఎందుకంటే ప్రమాదం సహజంగానే అర్థమవుతుంది. పేజీలోని ఒక note మారితే, మొత్తం వ్యాయామం ఉద్దేశం విఫలమవుతుంది. కానీ ఇదే తర్కం అనేక పని వాతావరణాల్లో కూడా వర్తిస్తుంది, అక్కడ documents, images లేదా data అర్థాన్ని కోల్పోకుండా ఉండాలి. వినియోగదారులు ఎక్కువగా తెలివిగా అనిపించినా, తక్కువగా అంచనా వేయగలిగే వ్యవస్థకంటే, verify చేయగల, మళ్లీ నడపగల, మరియు scopeలో పరిమితమైన వ్యవస్థనే ఇష్టపడతారు.
దీని అర్థం direct AI editingకు స్థానం లేదని కాదు. అనేక creative మరియు low-stakes పనుల కోసం అది వేగవంతంగా, పూర్తిగా ఆమోదయోగ్యంగా ఉంటుంది. కానీ “ఫైల్ను మోడల్నే చూసుకోనివ్వండి” అన్నదే ఎప్పుడూ ఉత్తమ సమాధానం కాదని ఈ article చూపిస్తుంది. కొన్నిసార్లు AI యొక్క ఉత్తమ ఉపయోగం, పనికి సంబంధించిన తుది artifactను కాదు, దాని చుట్టూ ఉన్న boring infrastructureను తయారు చేయించడంలో ఉంటుంది.
AI adoption తదుపరి దశకు ఉపయోగకరమైన pattern
ZDNET కథ ప్రభావవంతంగా ఉండటానికి కారణం, అది విస్తరించే అవకాశం ఉన్న patternను వివరిస్తుంది. ముఖ్యంగా సాంప్రదాయ tools చాలా భారంగా అనిపించినప్పుడు, పూర్తిగా generative workflows చాలా ప్రమాదకరంగా అనిపించినప్పుడు, ప్రజలు అవసరమైనప్పుడు చిన్న software utilities నిర్మించడానికి AIను మరింతగా వాడతారు. దాంతో AI తగ్గిపోదు. అది stackలో ఒక పొర లోతుకు వెళ్లి, సంగీతాన్ని వాయించడానికి బదులుగా వాయిద్యాన్ని తయారు చేయడంలో సహాయపడుతుంది.
ఇది రోజువారీ computingలో మోడళ్లకు ఉండే అత్యంత స్పష్టమైన practical పాత్రలలో ఒకటి కావచ్చు. అవి custom scriptingకు పట్టే సమయాన్ని తగ్గించగలవు, developmentలోని boring భాగాలను automate చేయగలవు, మరియు సాధారణ వినియోగదారులకు కూడా ఒక్కసారిగా అవసరమైన toolలను సాధ్యంగా చేయగలవు. కానీ source material ముఖ్యమైనప్పుడు, తుది చర్య deterministicగా ఉండాలని చాలామంది ఇంకా కోరుకుంటారు.
ఆ అర్థంలో, PDF కథ నిజంగా పసుపు కాగితం లేదా choir practice గురించి కాదు. అది trust ఎలా engineered అవుతుందో గురించి. అత్యంత నిలకడైన AI workflows, generative speedను conventional software reliabilityతో కలిపేవే కావచ్చు, తద్వారా వినియోగదారులు రెండింటి ప్రయోజనాలను పొందగలరు, ఒకదాన్ని మరొకటిగా గందరగోళపరచకుండా.
ఈ కథనం ZDNET రిపోర్టింగ్ ఆధారంగా ఉంది. మూల కథనాన్ని చదవండి.
Originally published on zdnet.com





