Android एक अधिक सक्रिय AI platform बनत आहे
Google, Gemini साठी Android वर आणखी व्यापक विस्ताराची तयारी करत आहे, ज्यामुळे ते एका स्वतंत्र chatbot पलीकडे जाऊन operating system च्याही खोलवर पोहोचत आहे. आपल्या Google I/O developer conference पूर्वी, कंपनीने Gemini Intelligence जाहीर केले, जे Gemini ला दैनंदिन mobile वापरात अधिक थेट आणण्यासाठी तयार केलेल्या AI-powered features चा एक suite आहे.
Google ची मांडणी स्पष्ट आहे: उद्दिष्ट फक्त prompts ची उत्तरे देणे नाही, तर apps आणि services across वापरकर्त्यांना proactively गोष्टी पूर्ण करण्यात मदत करणे आहे. premium hardware आणि software यांच्या मिश्रणातून Gemini Intelligence आपल्या most advanced devices वर Gemini चे best आणेल, असे कंपनी सांगते.
ही भाषा महत्त्वाची आहे, कारण ती consumer AI मधील एक परिचित कल दर्शवते. स्पर्धा आता कोणाकडे chatbot आहे यावरून पुढे जाऊन, AI ला routine actions मध्ये कोण embed करू शकते याकडे वळत आहे. Google च्या मते, Android या बदलासाठी staging ground बनत आहे.
assistant पासून operator पर्यंत
सर्वात महत्त्वाचा feature set म्हणजे task automation. Google ने Gemini Intelligence ला multiple apps across पसरणाऱ्या activities हाताळण्यास सक्षम असे म्हटले आहे, जे अनेक मोठ्या platform companies महिन्यांपासून सूचित करत असलेल्या agentic model कडे एक पाऊल आहे.
Google ने दिलेली उदाहरणे flashy नसून व्यावहारिक आहेत. प्रणाली वापरकर्त्यांना spin class साठी front-row bike मिळवायला मदत करू शकते, Gmail मध्ये class syllabus शोधू शकते, आणि मग आवश्यक books shopping cart मध्ये टाकू शकते. ती grocery list चा फोटो घेऊन त्यानुसार Instacart cart देखील भरू शकते.
या उदाहरणांवरून असे दिसते की Google फोनवरील AI साठी सर्वात प्रभावी consumer argument conversation नसून convenience असेल, यावर पैज लावत आहे. feature विश्वासार्हरीत्या काम करत असल्यास, intention पासून action पर्यंत जाण्यासाठी लागणाऱ्या taps आणि app switches ची संख्या कमी होते. ते विसंगतपणे काम करत असल्यास, दैनंदिन कामे opaque automation failures मध्ये रूपांतरित होण्याचा धोका आहे.
रणनीतिक मुद्दा दोन्ही परिस्थितीत स्पष्ट आहे. Google ला Gemini ने software मध्ये काम करावे असे वाटते, केवळ त्याबद्दल बोलावे असे नाही.
Rambler आणि voice input चा पुढचा टप्पा
आणखी एक ठळक feature म्हणजे Rambler, एक speech-to-text tool जे filler words आणि repetition यांसह natural speech patterns विचारात घेण्यासाठी तयार केलेले आहे. वापरकर्त्यांनी स्वच्छपणे dictate करावे अशी अपेक्षा करण्याऐवजी, Google म्हणते की Rambler बोललेल्या गोष्टीतील महत्त्वाचे भाग ओळखू शकतो आणि त्यांना संक्षिप्त संदेशात रूपांतरित करू शकतो.
हे किरकोळ वाटू शकते, पण voice interfaces मधील एका खऱ्या कमकुवतपणाला ते हात घालते. अनेक लोक नीट, punctuation-ready वाक्यांत बोलत नाहीत. ते बोलता बोलता स्वतःला दुरुस्त करतात, phrases पुन्हा म्हणतात, आणि मुद्द्यावर येण्याआधी इकडे-तिकडे जातात. अशा speech ला स्पष्टपणे distill करणारी प्रणाली messaging आणि note-taking contexts मध्ये voice input अधिक उपयुक्त बनवू शकते.
Google असेही म्हणते की Rambler एकाच message मध्ये वेगवेगळ्या भाषांमध्ये switch करू शकतो. हे feature multilingual communication प्रत्यक्षात कशी चालते, विशेषतः ज्या प्रदेशांत code-switching अपवाद नसून सामान्य आहे, ते दर्शवते.
कंपनीने privacy signal देखील जोडला आहे, Rambler enabled असल्याचे स्पष्टपणे दाखवतो आणि audio केवळ real-time transcription साठीच वापरले जाते, ते साठवले किंवा saved केले जात नाही, असे सांगितले आहे.
वैयक्तिक data, opt-in controls, आणि browser reach
Google Gemini Intelligence द्वारे AI-powered autofill देखील वाढवत आहे. ही प्रणाली Personal Intelligence वर आधारित राहून वापरकर्त्याच्या वतीने forms आणि text fields भरू शकते; हा एक opt-in layer आहे, ज्यामुळे Gemini ला YouTube history आणि Google search records सारख्या माहितीवर access मिळतो.
हे rollout मधील सर्वात वादग्रस्त भागांपैकी एक ठरू शकते. एकीकडे, autofill ला वापरकर्त्याचा संदर्भ माहीत असल्यास ते अधिक उपयुक्त ठरते. दुसरीकडे, तीच contextual depth एका personal assistant ने किती जाणले पाहिजे आणि वापरकर्ते तो data किती सहजतेने देतील याबद्दल अपेक्षित चिंता निर्माण करते. Google चे उत्तर म्हणजे हा feature strictly opt-in आहे, यावर भर देणे.
Android साठी Chrome मध्येही Gemini अधिक खोलवर जात आहे. desktop experiences प्रमाणे web across content summarize आणि compare करण्यास assistant सक्षम असेल, तसेच appointment booking सारखी browser-based tasks automate करण्यासाठी auto browse capability मिळेल, असे Google म्हणते.
हे apps पासून web पर्यंत तेच operating logic विस्तारित करते: AI ला users आणि interfaces यांच्या दरम्यान एक action layer म्हणून ठेवले जात आहे, जे मूळतः manual navigation साठी तयार झाले होते.
टप्प्याटप्प्याने rollout आणि व्यापक परिणाम
नवीन features waves मध्ये येतील, सुरुवात नवीनतम Samsung Galaxy आणि Google Pixel phones पासून होईल, असे Google सांगते. काही Chrome-related capabilities जूनमध्ये अपेक्षित असल्याचेही कंपनीने सांगितले.
हा staged rollout सध्याच्या AI market मधील एक महत्त्वाची वास्तवता अधोरेखित करतो. कंपन्या software advances सार्वत्रिक भाषेत मांडत असल्या तरी, त्या अनेकदा प्रथम premium-device features म्हणून लाँच करतात. यामुळे performance expectations आणि hardware demands नियंत्रित करण्यास मदत होते, पण याचा अर्थ असा देखील होतो की smartphone AI चा पुढचा टप्पा सुरुवातीला वापरकर्त्यांच्या अरुंद गटासाठीच उपलब्ध असेल.
तरीही, ही घोषणा स्पष्ट दिशा बदल दर्शवते. Gemini आता मुख्यतः Android च्या शेजारी बसलेला ऐच्छिक assistant म्हणून सादर केला जात नाही. तो core mobile behaviors मध्ये विणला जात आहे: typing, browsing, shopping, scheduling, आणि app-to-app coordination.
वापरकर्ते ते स्वीकारतील की नाही, हे दोन अनुत्तरित प्रश्नांवर अवलंबून आहे. पहिला reliability. Agentic दावे तेव्हाच आकर्षक ठरतात जेव्हा system कामे अचूक आणि अंदाजे पूर्ण करू शकते. दुसरा trust. ही systems जितकी सक्षम होत जातात, तितकी ती personal context वर अधिक अवलंबून राहतात, आणि वापरकर्त्यांना हा बदल योग्य आहे की नाही हे ठरवावे लागते.
Google ने दोन्ही आघाड्यांवर एकाच वेळी पुढे जाण्याचा निर्णय घेतला आहे. त्यामुळे Gemini Intelligence हे पाहण्यासारख्या महत्त्वाच्या Android बदलांपैकी एक ठरते, कारण ते mobile AI संपले आहे हे सिद्ध करत नाही, तर platform companies आता AI ला operating system मध्ये विलीन करून वापरकर्त्याच्या वतीने कार्य करायला किती आक्रमकपणे इच्छितात हे दाखवते.
हा लेख Gizmodo च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.
Originally published on gizmodo.com


