Circle to Commerce से

जब गूगल ने जनवरी 2024 में Circle to Search को पेश किया, तो यह एक लंबे समय की समस्या के लिए एक सुंदर समाधान के रूप में शुरू हुआ: आपकी फोन स्क्रीन पर दिख रही किसी चीज़ को खोजने में शामिल घर्षण। स्क्रीनशॉट लेने, ब्राउज़र पर स्विच करने, Google Lens खोलने और स्क्रीनशॉट अपलोड करने के बजाय, Circle to Search उपयोगकर्ताओं को बस होम बटन को लंबे समय तक दबाने और जो कुछ भी खोजना चाहते हैं उसके चारों ओर एक सर्कल खींचने देता है - पाठ, छवि, उत्पाद, चेहरा - उन्हें जिस ऐप में थे उसे छोड़े बिना। इस फीचर को तब से दसियों लाख Android डिवाइस में विस्तारित किया गया है और गूगल द्वारा पिछले दो वर्षों में भेजी गई सबसे सफल AI-संचालित सुविधाओं में से एक के रूप में उद्धृत किया गया है।

अब गूगल एक दिशा में Circle to Search की क्षमताओं को गहरा कर रहा है जो इसकी उपयोगिता और, संयोग से, इसकी वाणिज्यिक क्षमता को महत्वपूर्ण रूप से विस्तारित करेगा। नई अपडेट का एक सेट जो गूगल विजुअल इंटेलिजेंस फीचर कह रहा है: छवियों के भीतर विशिष्ट फैशन आइटम, होम डेकोर उत्पाद और उपभोक्ता सामान को पहचानने की क्षमता - और शॉपिंग योग्य परिणामों को सामने लाना जो उपयोगकर्ताओं को ये आइटम कहां बेचे जाते हैं, किस कीमत पर और किन कॉन्फ़िगरेशन में यह खोजने देते हैं। विजुअल सर्च में पूरी तस्वीर देखने की नई क्षमता के साथ - एक दृश्य में वस्तुओं के बीच स्थानिक और संदर्भपूर्ण संबंधों को समझना - अपडेट Circle to Search कर सकता है इस बात का एक महत्वपूर्ण विस्तार दर्शाते हैं।

फैशन सर्च: प्रमुख उपयोग केस

फैशन की पहचान की क्षमता नई सुविधाओं में सबसे तुरंत उपयोगकर्ता-सामने वाली है। इसका उपयोग करते हुए, एक उपयोगकर्ता Instagram पोस्ट, Pinterest pin, वेबसाइट छवि में, या यहां तक कि अपने कैमरे से लिए गए फोटो में कपड़ों का एक टुकड़ा सर्कल कर सकता है, और परिणाम प्राप्त कर सकता है जो विशिष्ट आइटम की पहचान करता है (जब यह एक पहचानने योग्य उत्पाद है), कई खुदरा विक्रेताओं से दृष्टिकोण से समान आइटम, और वर्तमान मूल्य निर्धारण और उपलब्धता के बारे में जानकारी। सिस्टम गूगल के विजुअल एम्बेडिंग मॉडल का उपयोग करता है - वही तकनीक जो Google Lens की उत्पाद खोज को रेखांकित करती है - लेकिन Circle to Search इंटरफेस में नेटिवली एकीकृत और आंशिक विचारों, अलग-अलग प्रकाश स्थितियों और आंशिक रूप से अस्पष्ट आइटम को संभालने के लिए विस्तारित।

व्यावहारिक उपयोग का मामला वह है जिसे फैशन-सचेत उपभोक्ता तुरंत पहचानेंगे: कोई ऐसी चीज़ देखना जो कोई पहन रहा है, इसे खोजना चाहते हैं या कुछ समान चाहते हैं, और पाठ खोज शर्तों में इसे वर्णित करने के कठिन प्रक्रिया का सामना करना। फैशन के लिए Circle-to-search उस घर्षण को पूरी तरह से ढह देता है। पहचान की सटीकता इस बात पर निर्भर करती है कि आइटम कितना विशिष्ट है - एक बहुत ही विशिष्ट डिजाइनर टुकड़ा पहचानने योग्य ब्रांडिंग या विवरणों के साथ एक सामान्य ठोस रंग की टी-शर्ट की तुलना में अधिक आसानी से पहचानी जाती है - लेकिन गूगल की अरबों उत्पाद छवियों में व्यापक प्रशिक्षण डेटा सिस्टम को एक विस्तृत मान्यता आधार देता है।

होम डेकोर और उत्पाद पहचान

वही विजुअल पहचान क्षमताएं होम डेकोर और उपभोक्ता इलेक्ट्रॉनिक्स तक विस्तारित होती हैं, श्रेणियां जिनमें उपयोगकर्ता अक्सर फोटोग्राफ में आइटमों का सामना करते हैं - संपादकीय सामग्री, सोशल मीडिया पोस्ट, रीयल एस्टेट लिस्टिंग - और खरीद के लिए उन्हें खोजना चाहते हैं। एक विशिष्ट दीपक, एक विशेष रग पैटर्न, या कमरे की फोटोग्राफ से एक मॉडल टेलीविजन की पहचान करना ऐतिहासिक रूप से छवि खोज प्रणालियों के लिए एक कठिन समस्या रही है क्योंकि ये आइटम अक्सर कोणों पर, अलग-अलग प्रकाश के तहत, और आंशिक विचारों में दिखाई देते हैं जो सटीक पहचान को चुनौती देते हैं।

गूगल के अपडेट किए गए मॉडल इन परिदृश्यों को अधिक gracefully संभालते हैं वस्तु को अपने दृश्य संदर्भ के भीतर समझकर एक पृथक उत्पाद छवि के रूप में इसे मिलान करने की कोशिश करने के बजाय। सिस्टम यह समझता है कि एक कमरे की फोटोग्राफ की पृष्ठभूमि में एक वस्तु संभवतः फर्नीचर या सजावट है, पहचान प्रक्रिया में इस पूर्वधारणा को लाता है, और ऐसे परिणाम सामने लाता है जो देखने के कोण और प्रकाश स्थितियों को ध्यान में रखते हैं न कि सटीक पहचान के लिए एक स्वच्छ कैटलॉग-शैली छवि की आवश्यकता होती है।

वाणिज्यिक आयाम

इन अपडेट का विश्लेषण करना भोला होगा बिना उनके वाणिज्यिक आयाम को स्वीकार किए। गूगल का मुख्य विज्ञापन व्यवसाय उपयोगकर्ता इरादे को वाणिज्यिक अवसरों से जोड़ने पर निर्भर करता है, और विजुअल सर्च उस कनेक्शन के लिए एक विशाल अनुपयोग किया गया सतह क्षेत्र का प्रतिनिधित्व करता है। जब एक उपयोगकर्ता एक छवि में एक उत्पाद को सर्कल करता है, तो वह क्रय इरादे की अभिव्यक्ति होती है जो अधिकांश पाठ खोजों की तुलना में अधिक विशिष्ट और कार्रवाई योग्य होती है। तुरंत शॉपिंग योग्य परिणामों को उस इरादे से सामने लाने की क्षमता - और ऐसा करना उन ऐप्स के अंदर जहां उपयोगकर्ता पहले से ही engaged हैं न कि उन्हें गूगल पर navigate करने की आवश्यकता होती है - विज्ञापन और वाणिज्य दृष्टिकोण से बेहद मूल्यवान है।

गूगल शॉपिंग वर्षों से एक महत्वपूर्ण राजस्व अवदानकर्ता रहा है, और शॉपिंग परिणामों के साथ Circle to Search का एकीकरण अनिवार्य रूप से Android डिवाइस पर किसी भी छवि को एक संभावित वाणिज्य touchpoint में बदल देता है। कंपनी इसे उपयोगकर्ता लाभ के रूप में प्रस्तुत करने के लिए सावधान है - आप जो चाहते हैं उसे आसानी से खोजना - और अधिकांश उपयोग के मामलों में, वह फ्रेमिंग सटीक है। लेकिन उपयोगकर्ता सुविधा और गूगल के वाणिज्यिक हितों के बीच संरेखण संयोगी नहीं है, और यह ध्यान देने योग्य है कि विजुअल AI सुधार जो सबसे प्रत्यक्ष रूप से वाणिज्य को सक्षम करते हैं वे ही हैं जो गूगल की उत्पाद घोषणाओं में सबसे प्रमुख प्लेसमेंट प्राप्त कर रहे हैं।

आगे की ओर देख रहे हैं

Circle to Search अपडेट गूगल की on-device AI क्षमताओं के व्यापक विकास का हिस्सा हैं। जैसे Gemini Nano और संबंधित मॉडल मोबाइल हार्डवेयर पर सीधे रूप से अधिक sophisticated कार्यों को चलाने में सक्षम हो जाते हैं, जो features को पहले गूगल के सर्वर को डेटा भेजने की आवश्यकता होती थी वह अब locally निष्पादित किया जा सकता है, latency और privacy दोनों के लिए निहितार्थ के साथ। गूगल ने संकेत दिया है कि कुछ Circle to Search विजुअल प्रोसेसिंग मॉडल efficiency में सुधार होने पर on-device execution की ओर बढ़ेगा, जो फीचर को ऑफलाइन काम करने और विजुअल searches से जुड़े डेटा ट्रांसफर को कम करने देगा। अभी के लिए, क्लाउड इंटेलिजेंस और on-device execution का संयोजन Circle to Search को एक क्षमता प्रोफाइल देता है जो competitors के लिए गूगल के प्रशिक्षण डेटा के पैमाने और infrastructure तक पहुंच के बिना मेल करना मुश्किल है।

यह लेख गूगल AI Blog की reporting के आधार पर है। मूल लेख पढ़ें