Google Gemini ला chatbot मधून operating-system assistant मध्ये विस्तारत आहे

Google आपला Gemini प्रयत्न Android च्या दैनंदिन कामकाजात अधिक खोलवर नेत आहे, standalone AI assistant पासून असे software तयार करत आहे जे वापरकर्त्यांना अॅप्स आणि सेवांमध्ये कामे पूर्ण करण्यात मदत करू शकते. Google I/O पूर्वी, कंपनीने Gemini Intelligence या बॅनरखाली नवीन features चा एक संच मांडला, जो बहुपायरी कृती automate करण्यासाठी, autofill सुधारण्यासाठी, web content संक्षेप करण्यासाठी, आणि विस्कळित spoken input ला नीटस written text मध्ये रूपांतरित करण्यासाठी डिझाइन केला आहे.

कंपनीच्या घोषणेनुसार, प्रारंभिक rollout या उन्हाळ्यात Samsung Galaxy S26 आणि Google Pixel 10 वर होणार आहे. Google ने असेही सांगितले की वर्षाच्या उत्तरार्धात smartwatch, cars, headsets, आणि laptops यांसह व्यापक device support नियोजित आहे. ही वेळापत्रक महत्त्वाची आहे कारण Google ही वैशिष्ट्ये एखाद्या niche प्रयोगासारखी पाहत नाही हे त्यातून दिसते. त्याऐवजी, Gemini ला Android ecosystem वर बसणाऱ्या एका layer म्हणून आणि लोक devices व services कसे navigate करतात याचा भाग म्हणून ठेवले जात आहे.

उत्तरांपासून कृतींकडे

सर्वात महत्त्वाचा बदल असा की Gemini आता responses तयार करणारी प्रणाली कमी आणि tasks पूर्ण करणारी प्रणाली अधिक म्हणून मांडली जात आहे. प्रवास booking करणे किंवा notes app मधील shopping list shopping cart मध्ये हलवणे यांसारखी कामे assistant हाताळू शकेल, असे Google म्हणते. ही उदाहरणे अशा consumer AI मॉडेलकडे निर्देश करतात जे केवळ conversation वर नव्हे तर orchestration वर अवलंबून आहे. मूल्य प्रस्ताव फक्त एवढा नाही की AI एखादा prompt समजू शकतो, तर तो intent ला अनेक interfaces मधून जाणाऱ्या टप्प्यांच्या मालिकेत रूपांतरित करू शकतो.

हा बदल AI मधील सर्वात महत्त्वाच्या स्पर्धात्मक मैदानांपैकी एक बनला आहे. Chatbots प्रश्नांची उत्तरे देऊ शकतात, मजकूर संक्षेप करू शकतात, आणि संदेशांचे मसुदे तयार करू शकतात, पण वापरकर्त्यांना अजूनही pages वर क्लिक करावे लागतात, तपशील कॉपी करावे लागतात, आणि अंतिम कृती स्वतः पूर्ण करावी लागते. Android मध्ये अधिक agent-like वर्तन थेट embed करून, Google त्या gap ला भरून काढण्याचा आणि digital friction सर्वाधिक असलेल्या क्षणी आपला assistant उपयोगी बनवण्याचा प्रयत्न करत आहे.

Chrome आणि Gboard चाचणीचे मैदान बनत आहेत

सर्वात स्पष्ट दोन उदाहरणे Chrome आणि Gboard मध्ये दिसत आहेत. Chrome मध्ये Gemini web content संक्षेप करेल आणि क्लिष्ट forms भरण्यास मदत करेल. form-filling वर्तन फक्त वापरकर्त्यांनी स्पष्टपणे enable केल्यावरच सक्रिय होईल, असे Google म्हणते; यामुळे privacy, control, आणि error risk याबाबत कंपनी scrutinyची अपेक्षा करत असल्याचे संकेत मिळतात. Forms AI automation साठी नैसर्गिक लक्ष्य आहेत कारण त्या पुनरावृत्तीच्या आणि वेळखाऊ असतात, पण त्यात personal data असते आणि चुका सहन करण्याची क्षमता कमी असते. Feature opt-in ठेवून Google सोयीसुविधा आणि automation गुपचूप संवेदनशील कामे ताब्यात घेणार नाही, याबद्दल वापरकर्त्यांना दिलासा देण्याची गरज यांच्यात समतोल साधत आहे.

Gboard मध्ये Rambler नावाचे feature येत आहे, जे spoken, अपूर्ण विचारांना स्वच्छ text messages मध्ये रूपांतरित करते. source नुसार, हे feature एकाच वेळी अनेक भाषांना support करू शकते. हे बहुभाषिक प्रदेशांमध्ये किंवा जिथे लोक वाक्याच्या मध्यात भाषा सहज बदलतात अशा घरांमध्ये विशेष उपयुक्त ठरू शकते. हे AI interfaces मधील व्यापक प्रवाहही दाखवते: वापरकर्त्यांना कडक formats मध्ये बोलायला किंवा टाइप करायला लावण्यापेक्षा, गोंधळलेल्या मानवी input ला सादर करण्यायोग्य गोष्टीत रूपांतरित करण्यासाठी लागणारा प्रयत्न कमी करण्याकडे system झुकत आहेत.

Customization ला prompt म्हणून पाहणे

Create My Widget हे आणखी एक feature interface customization वर केंद्रित आहे. वापरकर्ते recipe suggestions किंवा विशिष्ट weather information यावर लक्ष केंद्रित असलेले widget हवे आहे असे वर्णन करू शकतात, आणि system ते तयार करते. वरवर पाहता हे AI task automation पेक्षा लहान घोषणा वाटू शकते. पण हे दाखवते की software creation साठी natural language ला नवीन control layer म्हणून Google कसे पाहत आहे. मेनू किंवा layout tools फिरवण्याऐवजी, वापरकर्ते एका interface element चे वर्णन करतात आणि system ते assemble करते.

जर हा approach विश्वासार्हपणे चालला, तर devices वैयक्तिकृत करण्याचा अडथळा कमी होईल आणि Android ला आणखी एक वेगळी ओळख मिळेल. वर्षानुवर्षे Android ने काही प्रमाणात flexibility वर स्पर्धा केली आहे. वर्णनाद्वारे functional interface elements तयार करण्याची परवानगी देणे त्या ओळखीला AI युगात विस्तारते.

Google I/O पूर्वीची स्पर्धात्मक चाल

वेळही लक्षवेधी आहे. source Gemini Intelligence push ला AI agent market मध्ये OpenAI आणि Anthropic सोबतची दरी कमी करण्याच्या Google च्या प्रयत्नाशी जोडतो. तो market आता text निर्मितीपलीकडे जाणाऱ्या systems ने परिभाषित होत आहे. कंपन्या अशा assistants तयार करण्यासाठी शर्यत घेत आहेत जे software navigate करू शकतील, माहिती retrieve करू शकतील, आणि कमी user intervention सह अर्थपूर्ण कृती करू शकतील.

मे महिन्याच्या सुरुवातीला Google ने आपला experimental browser agent Project Mariner बंद करून त्याचे तंत्रज्ञान नवीन Gemini Agent मध्ये समाविष्ट करण्याचा निर्णय घेतला, ज्यातून अधिक unified strategy साठी आंतरिक एकत्रीकरणाचा संकेत मिळतो. experimental agent capabilities वेगळ्या ठेवण्याऐवजी, Google त्यांना आपल्या प्रमुख consumer AI stack मध्ये एकत्र करत असल्याचे दिसते. model quality इतकीच अशी consolidationही महत्त्वाची ठरू शकते, कारण वापरकर्ते सामान्यतः जिथे ते आधीच काम करतात, जसे की keyboards, browsers, आणि operating systems, तिथे दिसणारी features स्वीकारण्याची जास्त शक्यता असते.

हा rollout का महत्त्वाचा आहे

या घोषणा AI agents चा प्रश्न सुटला आहे हे सिद्ध करत नाहीत. प्रत्यक्ष जगातील automation अजूनही कमकुवत interfaces, अस्पष्ट user intent, आणि चुकीच्या कृतींच्या जोखमींशी झुंजत आहे. पण Google ची update उद्योग अधिक operational टप्प्यात प्रवेश करत असल्याचे सूचित करते. आता focus models demo मध्ये प्रभावी वाटतात का यावर कमी, आणि त्या लोकांच्या रोजच्या routine मध्ये कशा बसवायच्या यावर अधिक आहे.

rollout सुरळीत झाला तर Android वापरकर्ते AI ला destination म्हणून नव्हे, तर background infrastructure म्हणून पाहू लागतील: browser मधील summarizer, keyboard मधील cleaner, commerce flows मधील helper, आणि custom interface components तयार करणारा generator. हे consumer AI adoption मधील एक ठोस पाऊल ठरेल, कारण ते intelligence ला novelty ऐवजी utility शी जोडते.

  • Google सांगते की Gemini Intelligence या उन्हाळ्यात प्रथम Galaxy S26 आणि Pixel 10 वर लॉन्च होईल.
  • नवीन features automation, summarization, message drafting, आणि widget creation यांना लक्ष्य करतात.
  • ही चाल Gemini ला chatbot-only वापरापलीकडे agent-style सहाय्याकडे ढकलते.

हा लेख The Decoder च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.

Originally published on the-decoder.com