AI శిక్షణ డేటా కోసం Meta లోపలికి తిరుగుతోంది
కొన్ని అప్లికేషన్లపై తన ఉద్యోగుల మౌస్ కదలికలు, బటన్ క్లిక్లు, ఇతర వినియోగదారు ఇన్పుట్లను సేకరించనున్నట్లు Meta తెలిపింది; ఇది కృత్రిమ మేధస్సు మోడళ్లకు శిక్షణ ఇవ్వడానికి చేసిన ప్రయత్నంలో భాగం. కంపెనీ వివరణ కార్యాచరణాత్మకమైనది: కంప్యూటర్లపై రోజువారీ పనులను పూర్తి చేయడంలో సహాయపడే ఏజెంట్లను నిర్మించాలంటే, మనుషులు నిజంగా ఇంటర్ఫేస్లను ఎలా ఉపయోగిస్తారు, మెనూలలో ఎలా నావిగేట్ చేస్తారు, సాఫ్ట్వేర్ వాతావరణాల్లో చర్యలను ఎలా నిర్వహిస్తారు అనే ఉదాహరణలు మోడళ్లకు అవసరం.
మొదటి చూపులో ఆ కారణం అర్థం చేసుకోవడం సులభమే. కంప్యూటర్పై పని చేయాల్సిన వ్యవస్థకు, ఒక పని ఏమిటో మాత్రమే కాదు, ఒక వ్యక్తి దాన్ని ఎలా పూర్తి చేస్తాడో చూపించే ప్రవర్తనా జాడలు అవసరం. అయినప్పటికీ ఈ చర్య ప్రాధాన్యం కలిగింది, ఎందుకంటే ఇది AI పరిశ్రమలోని విస్తృత మార్పును సూచిస్తోంది. శిక్షణ డేటా ఇకపై ప్రజా పాఠ్యం, లైసెన్స్ పొందిన మీడియా, లేదా సంప్రదాయ లేబుల్ చేసిన డేటాసెట్లకే పరిమితం కాదు. మరింతగా, మోడల్ అభివృద్ధికి ముడిసరుకు మనుషుల పనితీరుకు సంబంధించిన రికార్డులుగా మారుతోంది.
Meta ఏమి సేకరిస్తోంది
మూల పాఠ్య ప్రకారం, కొన్ని అప్లికేషన్లపై “ఈ తరహా ఇన్పుట్లను” పట్టుకునే అంతర్గత టూల్ను ప్రారంభిస్తున్నట్లు Meta ఒక ప్రకటనలో తెలిపింది. ప్రజలు రోజువారీ కంప్యూటర్-ఆధారిత పనులను పూర్తి చేయడానికి సహాయపడే ఏజెంట్ల కోసం మోడళ్లను శిక్షణ ఇవ్వడమే దీని ఉద్దేశమని కంపెనీ చెప్పింది. సున్నితమైన విషయాలను రక్షించేందుకు భద్రతా చర్యలు ఉన్నాయని, ఆ డేటాను మరే ఇతర ప్రయోజనానికి ఉపయోగించడం లేదని కూడా Meta తెలిపింది.
ఆ పదజాలం ముఖ్యమైనది. ప్రకటన విస్తృత పర్యవేక్షణ కంటే పరస్పర చర్యల డేటాపై దృష్టి పెడుతుంది, కానీ అది సాధారణ కార్యాలయ ప్రవర్తనను శిక్షణ పదార్థంగా మార్చే వ్యవస్థను ఇంకా వివరిస్తోంది. క్లిక్లు, కర్సర్ కదలికలు, నావిగేషన్ నమూనాలు విడివిడిగా చిన్నవిగా కనిపించవచ్చు, కానీ కలిసి అవి డిజిటల్ వ్యవస్థల్లో పని ఎలా జరుగుతుందనే దానికి సమృద్ధమైన పటాన్ని తయారు చేస్తాయి.
ఈ రకమైన డేటా విలువైనది కావచ్చు, ఎందుకంటే అది కంప్యూటింగ్ యొక్క విధానాత్మక పొరను పట్టుకుంటుంది. పెద్ద భాషా మోడళ్లు ఇప్పటికే సాఫ్ట్వేర్ పనుల గురించి పాఠ్యాన్ని సృష్టించగలవు. కానీ వాస్తవ ఇంటర్ఫేస్లలో మనుషులు అనుసరించే దశలవారీ నమూనాల ఆధారిత ప్రవర్తనా సాక్ష్యం వాటికి చాలాసార్లు ఉండదు. అంతర్గత ఉద్యోగి వినియోగం అచ్చంగా అదే అందిస్తుంది.
AI పరిశ్రమ కొత్త ఇన్పుట్లను ఎందుకు వెతుకుతోంది
శిక్షణ డేటా కోసం విస్తృత పోటీ నేపథ్యంలో Meta తీసుకున్న నిర్ణయాన్ని ఈ నివేదిక ఉంచుతుంది. AI వ్యవస్థలు మరింత శక్తివంతంగా మారుతున్న కొద్దీ, కంపెనీలు మరింత పని-నిర్దిష్టమైన, తాజా, వాస్తవ ప్రపంచ ప్రవర్తనకు దగ్గరగా ఉండే మూలాలను అన్వేషిస్తున్నాయి. డిజిటల్ ఏజెంట్లుగా పనిచేయాలనుకునే వ్యవస్థలకు, టెక్స్ట్ మాత్రమే సరిపోదు. డెవలపర్లకు గ్రాఫికల్ ఇంటర్ఫేస్లు, ఫారాలు, బటన్లు, డ్రాప్డౌన్లు, మరియు పలు అప్లికేషన్లను దాటి సాగిన వర్క్ఫ్లోలతో పరస్పర చర్యల రికార్డులు అవసరం.
అందుకే అంతర్గత సంస్థ కార్యకలాపం ఆకర్షణీయంగా మారుతోంది. కంపెనీలలో ఇప్పటికే పెద్ద పరిమాణంలో ఆపరేషనల్ ప్రవర్తన ఉంటుంది: మీటింగ్ నోట్స్, సపోర్ట్ లాగ్స్, ప్రాజెక్ట్ చరిత్రలు, సాఫ్ట్వేర్ వినియోగ నమూనాలు, కమ్యూనికేషన్ ఆర్కైవ్స్. మరో ఇటీవలి ఉదాహరణలో పాత startups నుండి Slack ఆర్కైవ్స్, Jira టికెట్లు వంటి అంతర్గత కమ్యూనికేషన్లు సేకరించబడుతున్నాయని, అవి AI ఇంధనంగా తిరిగి ఉపయోగించబడవచ్చని మూల పాఠ్యం పేర్కొంది. నమూనా స్పష్టంగా ఉంది. ఒకప్పుడు సహకారం కోసం సృష్టించబడిన సమాచారం, ఇప్పుడు మోడల్ ఇన్పుట్గా తిరిగి అంచనా వేయబడుతోంది.
Meta విధానం భిన్నమైనది, ఎందుకంటే అది కేవలం చారిత్రిక రికార్డులను సేకరిస్తున్నది కాదు. నిర్దిష్ట ఉత్పత్తి లక్ష్యానికి మద్దతుగా ఉద్యోగుల నుండి ప్రత్యక్ష పరస్పర చర్య డేటాను సేకరిస్తోంది.
వ్యూహాత్మక లక్ష్యం: కంప్యూటర్ను ఉపయోగించే మెరుగైన ఏజెంట్లు
Meta ప్రకటన నేరుగా పణంగా ఉన్న ఉత్పత్తి వర్గాన్ని సూచిస్తోంది: కంప్యూటర్లపై రోజువారీ పనులను పూర్తి చేయడంలో వినియోగదారులకు సహాయపడే AI ఏజెంట్లు. ఇది పరిశ్రమలో ఒక ముఖ్యమైన సరిహద్దు. వర్క్ఫ్లోను వివరించగల చాట్బాట్కి, దాన్ని అమలు చేయగల ఏజెంట్కి మధ్య తేడా ఎంతో పెద్దది. ఆ అంతరాన్ని దాటడానికి, కంపెనీలకు భాషను మాత్రమే కాదు, ఇంటర్ఫేస్ ప్రవర్తనను కూడా అర్థం చేసుకునే మోడళ్లు అవసరం.
మౌస్ కదలికలు, క్లిక్లపై శిక్షణ ఇవ్వడం ద్వారా మోడళ్లు సాధారణ చర్యల క్రమాలు, సంభవించే ఇంటర్ఫేస్ అవకాశాలు, అప్లికేషన్లలో పని చేస్తూ మనుషులు ఎదుర్కొనే నిర్ణయ బిందువులను నేర్చుకోవచ్చు. ఇతర మాటల్లో చెప్పాలంటే, తక్కువ సారాంశాత్మకమైన, మరింత కార్యాచరణాత్మకమైన ఆటోమేషన్కు అవసరమైన ప్రవర్తనా ఆధారాన్ని కంపెనీ సేకరిస్తున్నట్లు కనిపిస్తోంది.
అందుకే ఈ చర్య ఒక అంతర్గత టూల్ అప్డేట్ కంటే పెద్దది. తదుపరి తరం AI వ్యవస్థలు ఎలా పోటీ పడతాయని కంపెనీలు ఆశిస్తున్నాయో దీనికి సాక్ష్యం ఉంది: సంభాషణ నాణ్యత మీద మాత్రమే కాదు, సాఫ్ట్వేర్ వాతావరణాల్లో చర్య తీసుకునే సామర్థ్యంపై కూడా.
గోప్యత, పాలన సమస్య
ఈ డేటాను ఉపయోగకరంగా 만드는 అదే తర్కం దానిని సున్నితంగా కూడా చేస్తుంది. కార్యాలయ పరస్పర చర్యలు తటస్థ అవశేషాలు కావు. అవి అలవాట్లు, ప్రాధాన్యతలు, తప్పులు, యాక్సెస్ నమూనాలు, కొన్ని సందర్భాల్లో సున్నితమైన సమాచారపు సంగ్రహాలను వెలికి తీయగలవు. Meta సేకరణను కొన్ని అప్లికేషన్లకే పరిమితం చేసి, భద్రతా చర్యలు ఉన్నాయని చెప్పినా, ఈ నిర్ణయం ఒకే కంపెనీకి పరిమితం కాని పాలనా ప్రశ్నను లేవనెత్తుతోంది: సాధారణ ఉద్యోగి కార్యకలాపంలో ఎంత భాగాన్ని model training కోసం తిరిగి ఉపయోగించవచ్చు, దాంతో workplace monitoring, product development మధ్య తేడా చెప్పడం కష్టమయ్యేంతవరకు?
సమస్య కేవలం ప్రైవేట్ కంటెంట్ బయటపడుతుందా లేదా అన్నది కాదు. అది సమ్మతి, పరిధి, మరియు ముందస్తు ఉదాహరణ గురించి కూడా. enterprise systems లోని user behavior ని శిక్షణ పదార్థంగా పరిగణించడం ప్రారంభమైనప్పుడు, ఏ రకమైన work traces ను సేకరించవచ్చు, అవి ఎంతకాలం ఉంచాలి, పనివారికి భాగస్వామ్యంలో నిజమైన మాట ఉందా అనే విషయాలపై సంస్థలు నియమాలను రూపకల్పన చేయాల్సి రావచ్చు. మూల పాఠ్యం ఆ ప్రశ్నలకు సమాధానం ఇవ్వదు, కానీ అవి ఎందుకు అత్యవసరమవుతున్నాయో స్పష్టం చేస్తుంది.
AI అభివృద్ధి ఏ దిశగా వెళుతోంది అనే సంకేతం
Meta యొక్క అంతర్గత డేటా-సేకరణ టూల్ ప్రస్తుత AI పోటీ గురించి ఒక పెద్ద నిజాన్ని చూపిస్తోంది. మోడల్ పురోగతి ప్రధానంగా మరింత ఇంటర్నెట్-స్థాయి టెక్స్ట్ సేకరణపై ఆధారపడిన దశను పరిశ్రమ దాటుతోంది. తదుపరి లాభాలు మరింత సంకుచితమైన, మరింత ప్రవర్తనా, నిర్దిష్ట పనులతో దగ్గరగా అనుసంధానమైన డేటా నుంచి రావొచ్చు. అది సాంకేతిక విధానాన్ని, డేటా వినియోగం చుట్టూ ఉన్న సామాజిక ఒప్పందాన్ని రెండింటినీ మార్చుతుంది.
Metaకి, సమీప కాలంలో వచ్చే లాభం కంప్యూటర్లను మరింత సమర్థవంతంగా నడిపే వ్యవస్థల కోసం మెరుగైన శిక్షణ కావచ్చు. విస్తృత మార్కెట్కు, ఈ ప్రకటన రోజువారీ డిజిటల్ ప్రవర్తన AI కోసం వ్యూహాత్మక మౌలిక సదుపాయంగా తిరిగి రూపుదిద్దుకుంటోందనే మరో సంకేతం.
చివరకు, అదే అత్యంత ముఖ్యమైన takeaway కావచ్చు. AI శిక్షణ భవిష్యత్తు, ప్రజలు ఆన్లైన్లో ఏమి చెబుతారు లేదా వ్రాస్తారు అనే దానిపైనే కాదు. వారు సాఫ్ట్వేర్లో ఎలా కదులుతారు, స్క్రీన్లపై ఎలా నిర్ణయాలు తీసుకుంటారు, డిజిటల్ పనిని ఎలా పూర్తి చేస్తారు అనే దానిపైనా ఆధారపడుతుంది. Meta ఆ మార్పును అసాధారణంగా స్పష్టంగా చేసింది. మిగిలిన పరిశ్రమ, అది తెరచే సాంకేతిక ప్రయోజనాలు మరియు పాలనా ప్రమాదాల రెండింటినీ దగ్గరగా గమనించే అవకాశం ఉంది.
ఈ వ్యాసం TechCrunch నివేదికపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.
Originally published on techcrunch.com





