పెద్ద స్థాయిలో విజువల్ సెర్చ్ సవాలు
మీరు మీ ఫోన్ కెమెరాను ఒక వస్తువు వైపు చూపించి, అది ఏమిటని Google ను అడిగినప్పుడు, అది వినియోగదారుడి దృష్టిలో సింపుల్ ప్రశ్నలా కనిపిస్తుంది. కానీ లోపల, వ్యవస్థ నిజంగా క్లిష్టమైన సమస్యను ఎదుర్కొంటుంది: టెక్స్ట్ ప్రశ్నలతో పోలిస్తే విజువల్ ప్రశ్నలు సహజంగానే అనిశ్చితంగా ఉంటాయి. ఒక మొక్క ఫోటోను గుర్తింపు కోసం అడుగుతున్నారా, సంరక్షణ సూచనల కోసం అడుగుతున్నారా, విషపూరితత సమాచారం కోసం అడుగుతున్నారా, ఎక్కడ కొనాలో తెలుసుకోవాలనుకుంటున్నారా, లేదా జాతి పేరు కావాలనుకుంటున్నారా — చిత్రమే వినియోగదారుడు ఏ సమాధానం కోరుకుంటున్నాడో స్పష్టంగా తెలియజేయదు.
ఈ అనిశ్చితిని పరిష్కరించడానికి Google తీసుకున్న విధానం query fan-out. ఇది AI Mode యొక్క విజువల్ సెర్చ్ సామర్థ్యాల గుండెల్లో ఉన్న సాంకేతికత. విజువల్ ప్రశ్నను ఒకే లుకప్గా పరిగణించకుండా, వ్యవస్థ చిత్రంలోనుంచి ఉద్భవించిన సంబంధిత ప్రశ్నల సమాహారాన్ని సృష్టించి, వాటిని ఒకేసారి నడిపి, ఫలితాలను సమ్మిళితం చేసి, వినియోగదారుడికి అత్యంత సాధ్యమైన అవసరాలను ముందే ఊహించే సమాధానాన్ని రూపొందిస్తుంది.
Query Fan-Out ఎలా పనిచేస్తుంది
ఈ fan-out ప్రక్రియ AI వ్యవస్థ చిత్రం విశ్లేషణతో ప్రారంభమవుతుంది. అందులో కనిపించే వస్తువులు, వాటి పరస్పర సంబంధాలు, కనిపించే ఏదైనా టెక్స్ట్, ఆ ప్రదేశానికి సంబంధించిన సందర్భ సంకేతాలు, అలాగే చిత్రం ఎటువంటి పరిస్థితుల్లో తీసినదో సూచించే సంకేతాలను గుర్తిస్తుంది. ఆ విశ్లేషణ ఆధారంగా, వ్యవస్థ అనేక candidate queries ను సృష్టిస్తుంది — ఇవి వినియోగదారుడు తెలుసుకోవాలనుకునే విషయానికి సాధ్యమైన వివరణలను ప్రతినిధ్యం వహిస్తాయి.
ఒక మొక్క ఫోటో కోసం, fan-out species identification, common names, growing conditions, pets and children కు toxic అవుతుందా, local గా ఎక్కడ కొనాలి వంటి సమాంతర ప్రశ్నలను సృష్టించవచ్చు. ఈ ప్రశ్నలు Google search index అంతటా ఒకేసారి నడుస్తాయి. ప్రతి stream నుండి వచ్చిన ఫలితాలను relevance కోసం పరిశీలించి, వాటిని coherent response గా సమ్మిళితం చేస్తారు. ఇది అత్యంత సాధ్యమైన user intent ను తీరుస్తూనే, వినియోగదారు స్పష్టంగా అడగకపోయినా ఉపయోగకరమైన సమాచారాన్ని ముందుకు తెస్తుంది.
ఇది వినియోగదారులకు ఎందుకు ముఖ్యమో
query fan-out యొక్క ప్రాయోగిక ప్రభావం ఏమిటంటే, AI Mode యొక్క visual search సాంప్రదాయ search engine కంటే జ్ఞానమున్న assistant లా ప్రవర్తిస్తుంది. సాధారణ image search దృశ్యపరంగా సమానమైన documents ను మాత్రమే తిరిగి ఇస్తుంది. కానీ query fan-out తో ఉన్న AI Mode, వినియోగదారు ఆ చిత్రంలోని అంశం గురించి అడగగలిగే ప్రశ్నలకు సమాధానాలు ఇస్తుంది — ఇది qualitatively వేరే రకం స్పందన.
వారు చూస్తున్న వస్తువుకు సంబంధించిన పదజాలం పరిమితంగా ఉన్నప్పుడు ఈ తేడా మరింత కీలకమవుతుంది. ఒక mushroom, skin condition, car part, లేదా circuit board component ను గుర్తించడానికి ప్రయత్నిస్తున్న వ్యక్తికి సమర్థవంతమైన text query నిర్మించడానికి కావలసిన పదాలు తెలియకపోవచ్చు. Visual query fan-out చిత్రం కంటెంట్ నుండి సాధ్యమైన ప్రశ్నలను ఊహించడం ద్వారా ఈ పదజాల సమస్యను దాటవేస్తుంది. అందువల్ల వినియోగదారు ఖచ్చితంగా ఏమి వెతుకుతున్నారో చెప్పలేకపోయినా కూడా ఉపయోగకరమైన సమాచారాన్ని అందిస్తుంది.
సాంకేతిక సవాళ్లు మరియు విస్తృత వినియోగాలు
పెద్ద స్థాయిలో query fan-out గణనీయమైన infrastructure అవసరాలను తెస్తుంది. ప్రతి visual search అభ్యర్థన కోసం అనేక parallel queries నడపడం computational cost ను పెంచుతుంది. response latency ఆమోదయోగ్యంగా ఉండేలా ఉంచడానికి జాగ్రత్తగా optimization అవసరం. synthesis challenge కూడా ఉంది: parallel queries విభిన్న ఫలితాలను ఇచ్చినప్పుడు, language model ఏవి అత్యంత సంబంధితమో నిర్ణయించాలి, పరస్పర విరుద్ధ సమాచారాన్ని ఎలా weigh చేయాలో చూడాలి, మరియు వినియోగదారులను ముంచెత్తకుండా synthesized responses ను coherent గా ఎలా చూపించాలో నిర్ణయించాలి.
ఈ fan-out architecture ను AI Mode లో text queries కు కూడా వర్తింపజేస్తున్నారు, కేవలం visual searches కే కాదు. ఇదే సూత్రం — ఒకే user input నుండి అనేక సంబంధిత queries సృష్టించి, ఫలితాలను సమ్మిళితం చేయడం — ఒకే search query సరైన రీతిలో పరిష్కరించలేని సంక్లిష్ట multi-part questions ను AI Mode సమాధానమిచ్చే సామర్థ్యానికి ఆధారంగా ఉంటుంది. Google ఈ వ్యవస్థను మెరుగుపరుస్తూనే ఉండగా, వివిధ query types మరియు contexts కోసం ఏ fan-out strategies అత్యంత సంతృప్తికరమైన responses ఇస్తాయో user behavior నుండి నేర్చుకుంటూ query fan-out మరింత sophisticated గా మారే అవకాశం ఉంది.
ఈ article Google AI Blog యొక్క reporting ఆధారంగా ఉంది. Original article ను చదవండి.
Originally published on blog.google


