Google नए टास्क-हैंडलिंग एजेंट्स के साथ Gemini को Android में गहराई से ले जा रहा है

Google ने Gemini को चैटबॉट से ऑपरेटिंग-सिस्टम असिस्टेंट में बदला

Google अपने Gemini प्रयास को Android की रोज़मर्रा की कार्यप्रणाली में और गहराई तक ले जा रहा है, और एक स्वतंत्र AI असिस्टेंट से आगे बढ़कर ऐसे सॉफ़्टवेयर की ओर जा रहा है जो उपयोगकर्ताओं को ऐप्स और सेवाओं के बीच काम पूरे करने में मदद कर सके। Google I/O से पहले, कंपनी ने Gemini Intelligence नाम के तहत नई सुविधाओं का एक सेट पेश किया, जिन्हें बहु-चरणीय कार्यों को स्वचालित करने, autofill बेहतर बनाने, वेब सामग्री का सार बनाने, और बिखरे हुए बोले गए इनपुट को परिष्कृत लिखित पाठ में बदलने के लिए डिज़ाइन किया गया है।

कंपनी के अनुसार, पहली रिलीज़ इस गर्मी में Samsung Galaxy S26 और Google Pixel 10 पर होगी। Google ने यह भी कहा कि साल के बाद के हिस्से में smartwatch, cars, headsets और laptops सहित व्यापक डिवाइस सपोर्ट की योजना है। यह समयरेखा महत्वपूर्ण है क्योंकि यह दिखाती है कि Google इन सुविधाओं को किसी सीमित प्रयोग की तरह नहीं देख रहा। इसके बजाय, वह Gemini को Android इकोसिस्टम की एक परत के रूप में स्थापित कर रहा है, जो धीरे-धीरे लोगों के डिवाइस और सेवाओं के उपयोग का हिस्सा बन सकती है।

जवाब से क्रिया तक

सबसे महत्वपूर्ण बदलाव यह है कि Gemini को अब प्रतिक्रियाएँ देने वाली प्रणाली से कम और कार्य पूरे करने वाली प्रणाली के रूप में अधिक प्रस्तुत किया जा रहा है। Google का कहना है कि असिस्टेंट यात्रा बुक करने या नोट्स ऐप से शॉपिंग कार्ट में शॉपिंग सूची स्थानांतरित करने जैसे काम संभाल सकेगा। ये उदाहरण उस consumer AI मॉडल की ओर इशारा करते हैं जो केवल बातचीत पर नहीं, बल्कि orchestration पर निर्भर है। मूल्य प्रस्ताव सिर्फ इतना नहीं है कि AI किसी prompt को समझ सकता है, बल्कि यह भी कि वह मंशा को कई interfaces में फैले चरणों की एक श्रृंखला में बदल सकता है।

यह बदलाव AI में सबसे महत्वपूर्ण प्रतिस्पर्धी मोर्चों में से एक बन गया है। Chatbots सवालों के जवाब दे सकते हैं, पाठ का सार बना सकते हैं, और संदेशों के मसौदे तैयार कर सकते हैं, लेकिन उपयोगकर्ताओं को अक्सर अब भी पेजों पर क्लिक करना, विवरण कॉपी करना और अंततः कार्य स्वयं पूरे करने पड़ते हैं। Android में अधिक agent-like व्यवहार सीधे जोड़कर Google इस अंतर को पाटने और उन क्षणों में अपने असिस्टेंट को उपयोगी बनाने की कोशिश कर रहा है जहाँ डिजिटल friction सबसे अधिक होती है।

Chrome और Gboard परीक्षण-स्थल बन रहे हैं

दो सबसे स्पष्ट उदाहरण Chrome और Gboard के भीतर दिखाई दे रहे हैं। Chrome में Gemini वेब सामग्री का सार बनाएगा और जटिल फ़ॉर्म भरने में मदद करेगा। Google का कहना है कि form-filling व्यवहार तभी सक्रिय होगा जब उपयोगकर्ता स्पष्ट रूप से उसे सक्षम करें, और यह विवरण दिखाता है कि कंपनी गोपनीयता, नियंत्रण, और त्रुटि जोखिम को लेकर जांच की उम्मीद कर रही है। फ़ॉर्म AI स्वचालन के लिए स्वाभाविक लक्ष्य हैं क्योंकि वे दोहरावदार और समय लेने वाले होते हैं, लेकिन इनमें व्यक्तिगत डेटा भी शामिल होता है और गलतियों के लिए बहुत कम सहनशीलता होती है। फ़ीचर को opt-in रखकर Google सुविधा और इस ज़रूरत के बीच संतुलन बनाने की कोशिश कर रहा है कि उपयोगकर्ताओं को भरोसा रहे कि स्वचालन चुपचाप संवेदनशील कार्यों पर कब्ज़ा नहीं कर लेगा।

Gboard में Rambler नाम की एक सुविधा आ रही है, जो बोले गए, अपूर्ण विचारों को साफ़-सुथरे टेक्स्ट संदेशों में बदल देती है। स्रोत के अनुसार, यह सुविधा एक साथ कई भाषाओं का समर्थन कर सकती है। इससे यह बहुभाषी क्षेत्रों या उन घरों में विशेष रूप से उपयोगी हो सकती है जहाँ लोग स्वाभाविक रूप से एक ही वाक्य में भाषाएँ बदलते हैं। यह AI interfaces के एक व्यापक रुझान को भी दिखाता है: प्रणालियाँ अब लोगों के बिखरे हुए इनपुट को प्रस्तुत करने योग्य रूप में बदलने के लिए आवश्यक मेहनत को कम करने की ओर बढ़ रही हैं, बजाय इसके कि उपयोगकर्ताओं को कठोर प्रारूपों में बोलना या टाइप करना पड़े।

अनुकूलन को prompt की तरह

Create My Widget नाम की एक और सुविधा interface customization पर केंद्रित है। उपयोगकर्ता उस widget का वर्णन कर सकते हैं जिसकी उन्हें ज़रूरत है, जैसे recipe सुझावों या विशिष्ट मौसम जानकारी पर आधारित widget, और सिस्टम उसे उत्पन्न कर देता है। सतही तौर पर यह AI task automation से छोटी घोषणा लग सकती है। लेकिन यह दिखाती है कि Google natural language को software creation के लिए एक नए control layer के रूप में कैसे देख रहा है। मेनू या layout tools के बजाय, उपयोगकर्ता एक interface element का वर्णन करते हैं और सिस्टम उसे assemble करता है।

यदि यह तरीका विश्वसनीय रूप से काम करता है, तो यह डिवाइस personalizing की बाधा कम कर सकता है और Android को एक और अलग पहचान दे सकता है। वर्षों से Android आंशिक रूप से flexibility पर प्रतिस्पर्धा करता आया है। लोगों को विवरण के आधार पर functional interface elements बनाने देना उस पहचान को AI युग में आगे बढ़ाता है।

Google I/O से पहले एक प्रतिस्पर्धी कदम

समय भी उल्लेखनीय है। स्रोत Gemini Intelligence push को AI agent market में OpenAI और Anthropic के साथ अंतर कम करने के Google के प्रयास से जोड़ता है। यह बाजार अब उन प्रणालियों से परिभाषित हो रहा है जो केवल पाठ उत्पन्न करने से अधिक करती हैं। कंपनियाँ ऐसे असिस्टेंट बनाने की दौड़ में हैं जो software navigation, सूचना retrieval, और सीमित उपयोगकर्ता हस्तक्षेप के साथ सार्थक कार्रवाई कर सकें।

मई की शुरुआत में Google द्वारा अपने experimental browser agent Project Mariner को बंद कर उसकी तकनीक को नए Gemini Agent में शामिल करने का निर्णय अधिक एकीकृत रणनीति के लिए आंतरिक समेकन का संकेत देता है। प्रयोगात्मक agent क्षमताओं को अलग रखने के बजाय, Google उन्हें अपने प्रमुख consumer AI stack में मिला रहा दिखता है। ऐसा समेकन model quality जितना ही महत्वपूर्ण हो सकता है, क्योंकि उपयोगकर्ता उन सुविधाओं को अपनाने की अधिक संभावना रखते हैं जो वहीं दिखाई देती हैं जहाँ वे पहले से काम करते हैं, जैसे keyboards, browsers और operating systems में।

यह rollout क्यों मायने रखता है

ये घोषणाएँ यह साबित नहीं करतीं कि AI agents का सवाल हल हो गया है। वास्तविक दुनिया का automation अब भी कमजोर interfaces, अस्पष्ट उपयोगकर्ता मंशा, और गलत कार्रवाई के जोखिम से जूझता है। लेकिन Google का अपडेट इस बात का संकेत है कि उद्योग एक अधिक operational phase में प्रवेश कर रहा है। फोकस अब इस पर कम है कि models demo में प्रभावित कर सकते हैं या नहीं, और इस पर अधिक है कि उन्हें लोगों की रोज़मर्रा की दिनचर्या में कैसे जोड़ा जाए।

यदि rollout सुचारु रहा, तो Android उपयोगकर्ताओं को AI कम एक destination और अधिक background infrastructure के रूप में दिखाई देना शुरू हो सकता है: browser में एक summarizer, keyboard में एक cleaner, commerce flows में एक helper, और custom interface components का generator। यह consumer AI adoption में एक ठोस कदम होगा क्योंकि यह intelligence को novelty के बजाय utility से जोड़ता है।

Google का कहना है कि Gemini Intelligence इस गर्मी में सबसे पहले Galaxy S26 और Pixel 10 पर लॉन्च होगी।
नई सुविधाएँ automation, summarization, message drafting और widget creation को लक्षित करती हैं।
यह कदम Gemini को chatbot-only उपयोग से आगे बढ़ाकर agent-style सहायता की ओर धकेलता है।

यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on the-decoder.com

Google ने नए टास्क-हैंडलिंग एजेंट्स के साथ Gemini को Android में और गहराई से जोड़ा