Google యొక్క Query Fan-Out: AI Visual Search నిజంగా ఎలా పనిచేస్తుంది

పెద్ద స్థాయిలో విజువల్ సెర్చ్ సవాలు

మీరు మీ ఫోన్ కెమెరాను ఒక వస్తువు వైపు చూపించి, అది ఏమిటని Google ను అడిగినప్పుడు, అది వినియోగదారుడి దృష్టిలో సింపుల్ ప్రశ్నలా కనిపిస్తుంది. కానీ లోపల, వ్యవస్థ నిజంగా క్లిష్టమైన సమస్యను ఎదుర్కొంటుంది: టెక్స్ట్ ప్రశ్నలతో పోలిస్తే విజువల్ ప్రశ్నలు సహజంగానే అనిశ్చితంగా ఉంటాయి. ఒక మొక్క ఫోటోను గుర్తింపు కోసం అడుగుతున్నారా, సంరక్షణ సూచనల కోసం అడుగుతున్నారా, విషపూరితత సమాచారం కోసం అడుగుతున్నారా, ఎక్కడ కొనాలో తెలుసుకోవాలనుకుంటున్నారా, లేదా జాతి పేరు కావాలనుకుంటున్నారా — చిత్రమే వినియోగదారుడు ఏ సమాధానం కోరుకుంటున్నాడో స్పష్టంగా తెలియజేయదు.

ఈ అనిశ్చితిని పరిష్కరించడానికి Google తీసుకున్న విధానం query fan-out. ఇది AI Mode యొక్క విజువల్ సెర్చ్ సామర్థ్యాల గుండెల్లో ఉన్న సాంకేతికత. విజువల్ ప్రశ్నను ఒకే లుకప్‌గా పరిగణించకుండా, వ్యవస్థ చిత్రంలోనుంచి ఉద్భవించిన సంబంధిత ప్రశ్నల సమాహారాన్ని సృష్టించి, వాటిని ఒకేసారి నడిపి, ఫలితాలను సమ్మిళితం చేసి, వినియోగదారుడికి అత్యంత సాధ్యమైన అవసరాలను ముందే ఊహించే సమాధానాన్ని రూపొందిస్తుంది.

Query Fan-Out ఎలా పనిచేస్తుంది

ఈ fan-out ప్రక్రియ AI వ్యవస్థ చిత్రం విశ్లేషణతో ప్రారంభమవుతుంది. అందులో కనిపించే వస్తువులు, వాటి పరస్పర సంబంధాలు, కనిపించే ఏదైనా టెక్స్ట్, ఆ ప్రదేశానికి సంబంధించిన సందర్భ సంకేతాలు, అలాగే చిత్రం ఎటువంటి పరిస్థితుల్లో తీసినదో సూచించే సంకేతాలను గుర్తిస్తుంది. ఆ విశ్లేషణ ఆధారంగా, వ్యవస్థ అనేక candidate queries ను సృష్టిస్తుంది — ఇవి వినియోగదారుడు తెలుసుకోవాలనుకునే విషయానికి సాధ్యమైన వివరణలను ప్రతినిధ్యం వహిస్తాయి.

ఒక మొక్క ఫోటో కోసం, fan-out species identification, common names, growing conditions, pets and children కు toxic అవుతుందా, local గా ఎక్కడ కొనాలి వంటి సమాంతర ప్రశ్నలను సృష్టించవచ్చు. ఈ ప్రశ్నలు Google search index అంతటా ఒకేసారి నడుస్తాయి. ప్రతి stream నుండి వచ్చిన ఫలితాలను relevance కోసం పరిశీలించి, వాటిని coherent response గా సమ్మిళితం చేస్తారు. ఇది అత్యంత సాధ్యమైన user intent ను తీరుస్తూనే, వినియోగదారు స్పష్టంగా అడగకపోయినా ఉపయోగకరమైన సమాచారాన్ని ముందుకు తెస్తుంది.

A Gatik autonomous truck at a PepsiCo distribution center.

Gatik PepsiCo నెట్‌వర్క్‌లో autonomous freight పాత్రను లోతుగా పెంచుతోంది

PepsiCo, Gatikతో తన పనిని multi-year deal ద్వారా విస్తరించింది; ఇది North American food and beverage logisticsలో autonomous middle-mile freightను మరింత లోతుగా తీసుకెళ్తోంది.

Read article

ఇది వినియోగదారులకు ఎందుకు ముఖ్యమో

query fan-out యొక్క ప్రాయోగిక ప్రభావం ఏమిటంటే, AI Mode యొక్క visual search సాంప్రదాయ search engine కంటే జ్ఞానమున్న assistant లా ప్రవర్తిస్తుంది. సాధారణ image search దృశ్యపరంగా సమానమైన documents ను మాత్రమే తిరిగి ఇస్తుంది. కానీ query fan-out తో ఉన్న AI Mode, వినియోగదారు ఆ చిత్రంలోని అంశం గురించి అడగగలిగే ప్రశ్నలకు సమాధానాలు ఇస్తుంది — ఇది qualitatively వేరే రకం స్పందన.

వారు చూస్తున్న వస్తువుకు సంబంధించిన పదజాలం పరిమితంగా ఉన్నప్పుడు ఈ తేడా మరింత కీలకమవుతుంది. ఒక mushroom, skin condition, car part, లేదా circuit board component ను గుర్తించడానికి ప్రయత్నిస్తున్న వ్యక్తికి సమర్థవంతమైన text query నిర్మించడానికి కావలసిన పదాలు తెలియకపోవచ్చు. Visual query fan-out చిత్రం కంటెంట్ నుండి సాధ్యమైన ప్రశ్నలను ఊహించడం ద్వారా ఈ పదజాల సమస్యను దాటవేస్తుంది. అందువల్ల వినియోగదారు ఖచ్చితంగా ఏమి వెతుకుతున్నారో చెప్పలేకపోయినా కూడా ఉపయోగకరమైన సమాచారాన్ని అందిస్తుంది.

సాంకేతిక సవాళ్లు మరియు విస్తృత వినియోగాలు

పెద్ద స్థాయిలో query fan-out గణనీయమైన infrastructure అవసరాలను తెస్తుంది. ప్రతి visual search అభ్యర్థన కోసం అనేక parallel queries నడపడం computational cost ను పెంచుతుంది. response latency ఆమోదయోగ్యంగా ఉండేలా ఉంచడానికి జాగ్రత్తగా optimization అవసరం. synthesis challenge కూడా ఉంది: parallel queries విభిన్న ఫలితాలను ఇచ్చినప్పుడు, language model ఏవి అత్యంత సంబంధితమో నిర్ణయించాలి, పరస్పర విరుద్ధ సమాచారాన్ని ఎలా weigh చేయాలో చూడాలి, మరియు వినియోగదారులను ముంచెత్తకుండా synthesized responses ను coherent గా ఎలా చూపించాలో నిర్ణయించాలి.

ఈ fan-out architecture ను AI Mode లో text queries కు కూడా వర్తింపజేస్తున్నారు, కేవలం visual searches కే కాదు. ఇదే సూత్రం — ఒకే user input నుండి అనేక సంబంధిత queries సృష్టించి, ఫలితాలను సమ్మిళితం చేయడం — ఒకే search query సరైన రీతిలో పరిష్కరించలేని సంక్లిష్ట multi-part questions ను AI Mode సమాధానమిచ్చే సామర్థ్యానికి ఆధారంగా ఉంటుంది. Google ఈ వ్యవస్థను మెరుగుపరుస్తూనే ఉండగా, వివిధ query types మరియు contexts కోసం ఏ fan-out strategies అత్యంత సంతృప్తికరమైన responses ఇస్తాయో user behavior నుండి నేర్చుకుంటూ query fan-out మరింత sophisticated గా మారే అవకాశం ఉంది.

ఈ article Google AI Blog యొక్క reporting ఆధారంగా ఉంది. Original article ను చదవండి.

Google మరియు OpenAI చైనాతో సంబంధం ఉన్న వేర్వేరు AI దుర్వినియోగ కార్యకలాపాలను బయటపెట్టాయి

Google ఒక AI-సক্ষম మోసపు నెట్‌వర్క్‌పై దావా వేసింది, అదే సమయంలో US చర్చలు మరియు మౌలిక సదుపాయాల కథనాలను లక్ష్యంగా చేసుకున్న చైనాతో సంబంధం ఉన్న రెండు ప్రభావ క్లస్టర్లను అడ్డుకున్నామని OpenAI తెలిపింది.

Read article

Originally published on blog.google

Google యొక్క AI విజువల్ సెర్చ్ లోపల: Query Fan-Out ఎలా పనిచేస్తుంది