Google local AIला अधिक लहान form factorमध्ये आणत आहे

Cloudकडे ती कामे परत पाठवण्याऐवजी compact devicesवर थेट AI workloads चालवण्यासाठी तयार केलेले नवीन Coral Board Googleने सादर केले आहे. Google I/O मध्ये जाहीर केलेले हे board कंपनीच्या Coral ecosystem भोवती तयार केले आहे आणि headphones, AR glasses, आणि smartwatches सारख्या productsना लक्ष्य करते, जिथे latency, connectivity, आणि power constraints यामुळे on-device processing विशेषतः उपयुक्त ठरते.

मुख्य दावा सरळ आहे: हे board त्याचा open-source Gemma 3 270M language model पूर्णपणे local पातळीवर चालवू शकते, असे Googleचे म्हणणे आहे. त्यामुळे हे hardware raw scaleपेक्षा जास्त त्याचे प्रतिनिधित्व काय आहे यासाठी महत्त्वाचे ठरते. Edge AI अनेकदा fragmented accelerators, मर्यादित memory budgets, आणि उपयोगी models लहान systemsवर बसवण्याच्या प्रत्यक्ष अडचणींमुळे मर्यादित राहिली आहे. त्या समस्येवर Coral Board हा अधिक सुसंगत उपाय असल्याचे Google मांडत आहे.

Hardwareमध्ये काय आहे

Boardच्या केंद्रस्थानी Synaptics Astra SL2619 chip आहे, ज्यात 2 GHz dual-core processor, 2 GB RAM, आणि 1 TOPS compute आहे. Google म्हणते की या boardमध्ये Coral NPU देखील आहे, जो RISC-V architectureवर आधारित एक open-source machine learning unit आहे आणि Google Researchने विकसित केला आहे.

या specificationsमुळे हे device त्या वर्गात बसते जिथे headline performanceपेक्षा efficiency आणि integration अधिक महत्त्वाचे असतात. Google हे board desktop-class AI machine म्हणून मांडत नाही. ते याला audio, vision, किंवा text थेट deviceवरच interpret करणे आवश्यक असलेल्या hardware साठी developer-friendly building block म्हणून मांडत आहे.

Local inference का महत्त्वाचे आहे

Gemma 3 स्थानिक पातळीवर चालवल्याने device काही कामे persistent cloud connection शिवाय हाताळू शकतो. यामुळे latency कमी होऊ शकते, responsiveness सुधारू शकते, आणि network reliabilityवरील अवलंबित्व कमी होऊ शकते. काही applicationsसाठी खर्चाची रचना देखील बदलते, कारण user बोलला, gesture केला, किंवा translation मागितली की प्रत्येक वेळी inference remote serviceकडे पाठवण्याची गरज नसते.

Googleची स्वतःची demonstrationsही या दिशेने सूचित करतात. I/O मध्ये कंपनीने real-time translation, voice-controlled hardware, आणि एक generative music setup दाखवला ज्यात YOLOv8 vision modelने jellyfishची movement track केली आणि ती musicमध्ये रूपांतरित केली. ही उदाहरणे दाखवतात की हे board फक्त model demosसाठी नाही, तर sensors, inference, आणि output यांना real timeमध्ये एकत्र करणाऱ्या interactive systemsसाठीही आहे.

Accelerator fragmentation कमी करण्याचा प्रयत्न

Googleच्या वर्णनातील एक मनोरंजक भाग म्हणजे AI acceleratorsमधील fragmentationसाठी हे एक उपाय म्हणून मांडणे. Wearables, smart devices, आणि embedded systems यांसारख्या categoriesमध्ये products बनवणाऱ्या developersसाठी ही एक खरी अडचण आहे. Models सिद्धांतात बसू शकतात, पण deployment बहुतेक वेळा incompatible toolchains, hardware quirks, आणि मर्यादित vendor supportमुळे अडखळते.

एक open-source NPU approach, ओळखीच्या model family, आणि public demos यांना एकत्र करून Google edge stack अधिक पूर्ण असल्याचे दाखवण्याचा प्रयत्न करत आहे. त्यामुळे thermal limits, battery use, किंवा memory ceilings यांभोवतीचे कठीण tradeoffs नाहीसे होत नाहीत. पण local AIला एक showcase featureवरून repeatable development pathमध्ये रूपांतरित करण्यासाठी अधिक गंभीर प्रयत्न चालू आहेत, हे नक्की सूचित होते.

Developersसाठी याचा अर्थ काय

हे board या summerमध्ये ship होण्याची अपेक्षा आहे, मात्र pricing Googleने जाहीर केलेले नाही. त्यामुळे एक मोठा व्यावहारिक प्रश्न अजूनही अनुत्तरित राहतो. Small-device AI hardware इतके स्वस्त, उपलब्ध, आणि program करण्यास सोपे असले पाहिजे की ते prototypesपलीकडे जाऊ शकेल.

तरीही, हे product edge AI कुठे जात आहे याबद्दल एक महत्त्वाची गोष्ट सांगते. वर्षभरापूर्वी AI hardwareबद्दलच्या अनेक चर्चांचा केंद्रबिंदू जवळपास पूर्णपणे giant clusters आणि data centers होते. बाजाराचा तो भाग अजूनही प्रबळ आहे. पण Googleचे नवीन board आठवण करून देते की AI buildoutचा आणखी एक front आहे: लहान devicesना पुरेशी local intelligence देणे, जेणेकरून ती cloud inferenceवर सतत अवलंबून न राहता अधिक autonomous आणि अधिक उपयुक्त बनू शकतील.

काय उठून दिसते

  • Gemma 3 270M cloud support शिवाय boardवर चालतो.
  • Hardware glasses, headphones, आणि wearables यांसारख्या compact productsना लक्ष्य करते.
  • Fragmented accelerator choicesमध्ये edge AI development सोपे करण्यासाठी Google हे board मांडत आहे.

Platform परवडणारा आणि software stack स्थिर असेल, तर Coral Board demo unitपेक्षा अधिक काही बनू शकतो. हे रोजच्या devicesमध्ये राहणाऱ्या AIकडे नेणारे एक व्यावहारिक पाऊल ठरू शकते, ज्याला नेहमी homeला call करावे लागत नाही.

हा लेख The Decoderच्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.

Originally published on the-decoder.com