सर्कलमधून वाणिज्यापर्यंत
जानेवारी 2024 मध्ये गूगलने Circle to Search सादर केले तेव्हा हे एक सुरुवातीच्या समस्येचे मार्जित समाधान होते: आपल्या फोन स्क्रीनवर दिसलेल्या काहीतरी शोधण्यामध्ये गोंधळ. स्क्रीनशॉट घेण्याऐवजी, ब्राउজरवर स्विच करून, Google Lens उघडून आणि स्क्रीनशॉट अपलोड करण्याऐवजी, Circle to Search ने वापरकर्त्यांना फक्त होम बटण लांबवर दाबून आणि त्यांना शोधू इच्छिताल्या कोणत्याही गोष्टीभोवती वर्तुळ काढू शकले - मजकूर, प्रतिमा, उत्पादन, चेहरा - असे अॅपमधून न गेल्याना. हे फीचर तेव्हापासून लक्ष लाखो Android उपकरणांवर विस्तारित झाले आहे आणि गूगलने त्याला गेल्या दोन वर्षांत शिप केलेल्या सर्वात यशस्वी AI-संचालित फीचरपैकी एक म्हणून उद्धृत केले आहे.
आता गूगल Circle to Search च्या क्षमतांना खोलवर जा रहा आहे असे दिशेने जे त्याच्या उपयोगिता आणि, संयोगाने नाही, त्याच्या व्यावसायिक संभाव्यता लक्षणीयरूपे विस्तारित करेल. नव्या अपडेट्सचा एक संच जोडला जातो जे गूगल ज्याला व्हिजुअल इंटेलिजेन्स फीचर म्हणतात: विशिष्ट फॅशन आयटम, गृह सजावट उत्पादन आणि प्रतिमांमधून ग्राहक मालसामान ओळखण्याची आणि शोधण्याची क्षमता - आणि शॉपेबल परिणाम दर्शविण्याची जी वापरकर्त्यांना हे शोधण्यास अनुमती देते की त्या वस्तू कोठे विकल्या जातात, किती किंमतीला आणि कोणत्या कॉन्फिगरेशनमध्ये. व्हिजुअल शोधामध्ये संपूर्ण चित्र पाहण्याची नवीन क्षमतेसह - एक दृश्यातील वस्तूंमधील स्थानिक आणि संदर्भ संबंध समजून - अपडेट्स Circle to Search करू शकणे त्याचा लक्षणीय विस्तार प्रतिनिधित्व करतात.
फॅशन शोध: मुख्य वापर केस
फॅशन ओळख क्षमता नवीन फीचरपैकी सर्वात लगेच वापरकर्ता-सामोरे आहे. त्याचा वापर करून, एक वापरकर्ता Instagram पोस्ट, Pinterest पिन, वेबसाइट प्रतिमा किंवा अगदी त्यांच्या कॅमेरासह घेतलेल्या फोटोमध्ये कपड्यांचा भाग मंडळ करू शकतो, आणि विशिष्ट वस्तूला ओळखणारे परिणाम प्राप्त करू शकतो, दृश्यमानपणे समान वस्तू अनेक किरकोळ विक्रेत्यांकडून, आणि वर्तमान किंमत आणि उपलब्धतेची माहिती. प्रणाली गूगलच्या व्हिजुअल एम्बेडिंग मॉडेल्स वापरते - हीच तंत्रज्ञान Google Lens च्या उत्पादन शोधाच्या अंतर्गत आहे - परंतु Circle to Search इंटरफेसमध्ये मूळत: एकीकृत केले गेले आणि आंशिक दृश्य, विविध प्रकाश परिस्थिती आणि आंशिकरूपे अस्पष्ट केलेल्या वस्तूंना हाताळण्यासाठी विस्तारित केले गेले.
व्यावहारिक वापर केस हा असा आहे जो फॅशन-जागरूक ग्राहकांना लगेच ओळखवेल: कोणी परिधान केलेली काहीतरी पाहणे, हे किंवा समान काहीतरी शोधू इच्छणे, आणि मजकूर शोध अटींमध्ये त्याचे वर्णन करण्याच्या कष्टप्रद प्रक्रियेचा सामना करणे. फॅशनसाठी सर्कल-टू-सर्च हा घर्षण पूर्णपणे दूर करते. ओळखीची अचूकता वस्तू किती वैशिष्ट्यपूर्ण आहे यावर अवलंबून असते - ओळखणारे ब्रँडिंग किंवा तपशील असलेले अत्यंत विशिष्ट डिजाइनर तुकडे एक सामान्य घन-रंग टी-शर्टपेक्षा अधिक सहजपणे ओळखले जाते - परंतु गूगलचा अरबो उत्पादन प्रतिमांवरील विस्तृत प्रशिक्षण डेटा प्रणालीला व्यापक ओळख आधार देतो.
गृह सजावट आणि उत्पादन ओळख
समान व्हिजुअल ओळख क्षमता गृह सजावट आणि ग्राहक इलेक्ट्रॉनिक्सपर्यंत विस्तारित होते, असे श्रेणी ज्यांमध्ये वापरकर्त्यांना वारंवार प्रतिमांमध्ये वस्तू आढळतात - संपादकीय सामग्री, सोशल मीडिया पोस्ट, रिअल एस्टेट लिस्टिंग - आणि त्यांना खरेदीसाठी शोधू इच्छितात. विशिष्ट दिवा, विशिष्ट गलीचा नमुना किंवा खोलीच्या फोटोग्राफमधून दूरदर्शन मॉडेल ओळखणे ऐतिहासिकदृष्ट्या प्रतिमा शोध प्रणालीसाठी एक कठिण समस्या आहे कारण हे वस्तू वारंवार कोनात, विविध प्रकाश अंतर्गत दिसतात, आणि अचूक ओळख आव्हानकारक बनवणाऱ्या अंशात दृश्य.
गूगलची अपडेट केलेली मॉडेल्स ही परिस्थिती अधिक अनुकूलपणे हाताळतात एकाकी उत्पादन प्रतिमा म्हणून जुळवण्याचा प्रयत्न करण्याऐवजी त्याच्या दृश्य संदर्भातील वस्तूबद्दल तर्क करून. प्रणाली समजते की खोलीच्या फोटोग्राफच्या पार्श्वभूमीतील वस्तू संभवतः फर्निचर किंवा सजावट आहे, त्या पूर्वीचे ओळख प्रक्रियेत आणते, आणि दृश्य कोन आणि प्रकाश परिस्थिती खातेतून परिणाम दर्शवते न अचूक ओळखीसाठी स्वच्छ कॅटलॉग-शैली प्रतिमा आवश्यक आहे.
व्यावसायिक परिमाण
त्यांच्या व्यावसायिक परिमाण स्वीकृती न घेता या अपडेट्सचे विश्लेषण करणे निष्ठुर असेल. गूगलचे मूल जाहिरातीचे व्यवसाय वापरकर्ता इच्छा व्यावसायिक संधी जोडण्यावर अवलंबून असते, आणि व्हिजुअल शोध त्या जोडणीसाठी एक विशाल अप्रयुक्त पृष्ठभाग प्रतिनिधित्व करते. जेव्हा वापरकर्ता प्रतिमामध्ये उत्पादन मंडळ करतो, तेव्हा ते खरेदी इच्छेचे अभिव्यक्ती असते जे सर्वात मजकूर शोधापेक्षा अधिक विशिष्ट आणि कार्यान्वयनीय आहे. त्या इच्छेपासून लगेच शॉपेबल परिणाम दर्शविण्याची क्षमता - आणि ते गूगलवर नेव्हिगेट करण्याची आवश्यकता न ठेवता वापरकर्त्यांना आधीच गुंतलेल्या अॅप्समध्ये करणे - जाहिरातीचे आणि व्यावसाय दृष्टिकोनातून अत्यंत मूल्यवान आहे.
Google Shopping बर्याच वर्षांपासून एक महत्वपूर्ण महसूल योगदानकर्ता आहे, आणि Circle to Search ला शॉपिंग परिणामांसह एकीकृत करणे मूलत: Android डिव्हाइसवरील कोणतीही प्रतिमा संभावित व्यावसाय स्पर्शबिंदूमध्ये बदलते. कंपनी हे वापरकर्ता लाभ म्हणून सादर करण्यासाठी सावधान आहे - तुम्हाला हवे ते सहजपणे शोधणे - आणि बहुतेक वापर प्रकरणांसाठी, हे फ्रेमिंग अचूक आहे. परंतु वापरकर्ता सोय आणि गूगलचे व्यावसायिक हित यांच्या मध्ये संरेखण संयोग नाही, आणि हे लक्षात घेण्यासारखे आहे की व्यावसायिकपणे सबसे प्रत्यक्ष रूप से सक्षम करणारे दृश्य AI सुधार गूगलच्या उत्पादन घोषणांमध्ये सर्वाधिक प्रमुख स्थान प्राप्त करत आहेत.
आगे पाहणे
Circle to Search अपडेट्स गूगलच्या ऑन-डिव्हाइस AI क्षमतांच्या विस्तृत विकासचा भाग आहेत. Gemini Nano आणि संबंधित मॉडेल्स मोबाइल हार्डवेअरवर थेट अधिक परिष्कृत कार्ये चालविण्यास सक्षम होत असताना, ज्या फीचरला पूर्वी गूगलच्या सर्व्हरला डेटा पाठविण्याची आवश्यकता होती ते स्थानिकरूपे चालविता येतात, विलंबता आणि गोपनीयता दोन्हीसाठी परिणाम असतात. गूगलने सूचित केले आहे की काही Circle to Search व्हिजुअल प्रक्रिया मॉडेल कार्यक्षमता सुधारत असताना ऑन-डिव्हाइस अंमलबजावणीकडे स्थलांतरित होईल, जी फीचर ऑफलाइनमध्ये कार्य करू देईल आणि व्हिजुअल शोधाशी संबंधित डेटा स्थानांतर कमी करेल. सध्या, क्लाउड इंटेलिजेन्स आणि ऑन-डिव्हाइस अंमलबजावणीचे संयोजन Circle to Search ला एक क्षमता प्रोफाइल देते जे गूगलच्या प्रशिक्षण डेटा आणि अवसंरचनाच्या स्केलला प्रवेश न करता प्रतिद्वंद्वींना जुळविणे कठिण आहे.
हा लेख Google AI Blog च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.




