Google का Gemma 4 फोन पर on-device agentic AI लाता है

Google अधिक AI काम को सीधे डिवाइस पर ला रहा है

The Decoder के अनुसार, Google का नवीनतम Gemma 4 रिलीज़ लोकल AI की ओर एक अधिक महत्वाकांक्षी कदम का संकेत देता है, जो क्लाउड पर निर्भर रहने के बजाय सीधे फोन और अन्य हार्डवेयर पर चलता है। यह नया ओपन-सोर्स मॉडल परिवार टेक्स्ट, इमेज और ऑडियो को पूरी तरह डिवाइस पर प्रोसेस कर सकता है, और यह अंतर्निहित “agent skills” के माध्यम से टूल्स का उपयोग भी कर सकता है, जैसे Wikipedia एक्सेस, इंटरैक्टिव मैप्स और QR कोड जनरेशन।

यह संयोजन इसलिए महत्वपूर्ण है क्योंकि यह मोबाइल AI के व्यावहारिक अर्थ को बदल देता है। कई उपभोक्ता सिस्टम खुद को असिस्टेंट के रूप में पेश करते हैं, लेकिन उनका मुख्य प्रोसेसिंग काम अक्सर अभी भी रिमोट सर्वरों पर निर्भर होता है। Gemma 4 को अलग तरह से रखा गया है। इसका आकर्षण केवल गति या सुविधा में नहीं है; यह डेटा को डिवाइस पर बनाए रखते हुए भी व्यापक कार्रवाइयों को सक्षम करने की क्षमता में है।

इसका समय उद्योग के व्यापक रुझान से मेल खाता है। जैसे-जैसे मॉडल अधिक कुशल होते जा रहे हैं और मोबाइल चिप्स बेहतर हो रही हैं, कंपनियाँ अधिक इंटेलिजेंस को edge hardware पर शिफ्ट करने की कोशिश कर रही हैं। इससे latency कम हो सकती है, server costs घट सकते हैं, और privacy से जुड़े दावे अधिक विश्वसनीय बन सकते हैं। Google अब इस तकनीकी दिशा को एक साथ developer platform और consumer-facing distribution channel में बदलने की कोशिश कर रहा है।

छोटे मॉडल मुख्यधारा के स्मार्टफोन को लक्ष्य बनाते हैं

The Decoder का कहना है कि Gemma 4 चार variants में आता है। इनमें से दो, E2B और E4B, खास तौर पर smartphones के लिए बनाए गए हैं। “E” का अर्थ effective parameters है, यानी inference के दौरान सक्रिय parameters। Quantized होने पर, E2B model डिवाइस पर लगभग 1.3 GB लेता है, जबकि E4B को करीब 2.5 GB की ज़रूरत होती है।

ये footprints उल्लेखनीय हैं क्योंकि ये सिर्फ premium hardware के लिए बने showcase model के बजाय एक व्यावहारिक deployment strategy की ओर इशारा करते हैं। रिपोर्ट कहती है कि E2B और E4B क्रमशः 6 GB और 8 GB RAM वाले phones पर चल सकते हैं। यदि यह रोज़मर्रा के उपयोग में सही साबित होता है, तो यह addressable installed base को काफी बढ़ा देगा और local multimodal AI को flagship devices पर कम निर्भर बनाएगा।

Google यह भी कहता है कि phone variants पिछली पीढ़ी की तुलना में चार गुना तक तेज़ चलते हैं, जबकि battery drain को 60 percent तक घटाते हैं। The Decoder द्वारा उद्धृत Arm के अपने benchmarks नए Arm chips पर और बड़े processing gains दिखाते हैं। वास्तविक दुनिया का अनुभव device के अनुसार अलग होगा, लेकिन संदेश स्पष्ट है: model architecture और hardware optimization अब raw size जितने ही महत्वपूर्ण होते जा रहे हैं।

OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need"

OpenAI ने इन्फ्रास्ट्रक्चर काम और लंबे उपभोक्ता विजन के इर्द-गिर्द रोबोटिक्स को फिर से खड़ा किया है

OpenAI ने अपनी रोबोटिक्स टीम को फिर से बनाया है, शुरुआत इन्फ्रास्ट्रक्चर कार्यों से करते हुए, जबकि CEO Sam Altman एक लंबे समय के लक्ष्य के रूप में सभी के लिए निजी रोबोटों की बात कर रहे हैं।

Read article

बड़ी कहानी cloud के बिना agentic capability है

इस release को एक साधारण efficiency update से अलग करने वाली बात tool use पर इसका जोर है। Gemma 4 को केवल एक compact multimodal model के रूप में नहीं बताया गया है। इसे एक agentic system के रूप में पेश किया गया है जो bundled skills के जरिए अपने आप specific tools को call कर सकता है। व्यावहारिक रूप से, इसका मतलब है कि locally चल रहा model prompt से सवालों के जवाब देने से आगे जा सकता है; वह remote service पर interaction भेजे बिना information retrieve कर सकता है, maps के साथ काम कर सकता है, या उपयोगी outputs generate कर सकता है।

इस architecture के रणनीतिक निहितार्थ हैं। On-device agents functionality और privacy के बीच एक अलग संतुलन का वादा करते हैं। यदि model, user inputs, और tool orchestration सब ऐसे hardware पर रहते हैं जिसे user नियंत्रित करता है, तो कंपनियाँ अधिक private AI experience दे सकती हैं और साथ ही richer workflows भी support कर सकती हैं।

यह customization का रास्ता भी खोलता है। The Decoder रिपोर्ट करता है कि developers GitHub के जरिए custom skills बना और साझा कर सकते हैं। इससे लगता है कि Google केवल model family ship नहीं कर रहा, बल्कि portable, local AI behaviors के आसपास एक ecosystem बनाने की कोशिश कर रहा है।

Google खुले release को व्यापक distribution के साथ जोड़ रहा है

Gemma 4 को Apache 2.0 license के तहत जारी किया गया है, जिसे The Decoder commercial-friendly बताता है। यह महत्वपूर्ण है क्योंकि licensing तय कर सकती है कि कोई model family गंभीर development foundation बनेगी या ज्यादातर research curiosity बनी रहेगी। एक permissive license experimentation, adaptation, और commercial deployment के लिए friction कम करता है।

Google Google AI Edge Gallery नामक मुफ्त app के जरिए Android और iOS पर भी इस अनुभव को वितरित कर रहा है। The Decoder का कहना है कि Gemma 4 लॉन्च होने के बाद से यह app Apple के iOS App Store में सबसे ज्यादा downloaded free productivity apps में चौथे स्थान पर पहुंच गया है, Claude, Gemini, और ChatGPT के बाद। भले ही rankings बदलती रहें, यह data point local AI experiences के प्रति शुरुआती consumer curiosity का महत्वपूर्ण स्तर दिखाता है।

रिपोर्ट आगे कहती है कि Gemma 4 Google के proprietary Gemini 3 model के समान research base पर बना है और smartphone variants Android पर Gemini Nano 4 की foundation के रूप में काम करेंगे। यह linkage महत्वपूर्ण है। यह संकेत देता है कि Google open और proprietary model lines को एक ही बड़े stack का हिस्सा मान रहा है, जिसमें Gemma एक developer platform और mobile deployment के proving ground दोनों के रूप में काम कर रहा है।

अध्ययन में पाया गया कि सामाजिक विज्ञान में एआई कोडिंग-एजेंट का उपयोग बेहद असमान है

Anthropic के एक अध्ययन में सामाजिक विज्ञान में कोडिंग-एजेंट अपनाने में बड़े अंतर पाए गए, जो लिंग, क्षेत्र, करियर चरण और विश्वविद्यालय रैंक के आधार पर बदलते हैं।

Read article

AI platforms की प्रतिस्पर्धा में यह रिलीज़ क्यों मायने रखती है

AI market increasingly कई overlapping contests में बंट रहा है: frontier cloud models, enterprise deployment, developer ecosystems, और अब device-native intelligence। Gemma 4 Google को आखिरी दो categories में मजबूत स्थिति देता है। Open weights, mobile optimization, tool use, और consumer app को जोड़कर, कंपनी local AI को builders और end users दोनों के लिए अधिक tangible बनाना चाहती है।

यह कदम प्रतिस्पर्धी आवश्यकता को भी दर्शाता है। यदि AI phones और अन्य personal devices पर default layer बननी है, तो efficient local models और उनके आसपास के developer experience को नियंत्रित करने वाली कंपनियों को महत्वपूर्ण लाभ मिलेगा। Cloud access बड़े workloads के लिए केंद्रीय बना रहेगा, लेकिन हर interaction को data-center-scale response की ज़रूरत नहीं होती।

Gemma 4 इसलिए एक अधिक hybrid future की ओर इशारा करता है। कुछ AI tasks remote रहेंगे क्योंकि उन्हें बड़े models या व्यापक compute की आवश्यकता होती है। अन्य increasingly वहीं चलेंगे जहाँ user पहले से है: handset पर, operating system के अंदर, और संवेदनशील personal data के करीब।

Google के लिए, यह release उस future को जल्दी आकार देने की कोशिश है। Developers के लिए, यह एक अधिक practical local foundation देता है। Users के लिए, यह संकेत देता है कि “आपके फोन पर AI” जल्द ही cloud के लिए सिर्फ एक branded shortcut से कहीं अधिक literal अर्थ रख सकता है।

यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on the-decoder.com

Google ने Gemma 4 और इन-बिल्ट एजेंट स्किल्स के साथ डिवाइस-पर AI को और आगे बढ़ाया

Google अधिक AI काम को सीधे डिवाइस पर ला रहा है

छोटे मॉडल मुख्यधारा के स्मार्टफोन को लक्ष्य बनाते हैं

OpenAI ने इन्फ्रास्ट्रक्चर काम और लंबे उपभोक्ता विजन के इर्द-गिर्द रोबोटिक्स को फिर से खड़ा किया है

बड़ी कहानी cloud के बिना agentic capability है

Google खुले release को व्यापक distribution के साथ जोड़ रहा है

अध्ययन में पाया गया कि सामाजिक विज्ञान में एआई कोडिंग-एजेंट का उपयोग बेहद असमान है

AI platforms की प्रतिस्पर्धा में यह रिलीज़ क्यों मायने रखती है

Comments (0)

Related Articles

AI मॉडल ने रेसिपी की तर्क-प्रणाली को स्वाद-रसायन से अलग किया

MISUMI ने $1 अरब के AI निर्माण दांव के साथ Americas अभियान शुरू किया

Microsoft और Nvidia कथित तौर पर AI PCs को स्थानीय एजेंटों की ओर धकेल रहे हैं

Keep Reading