Google local AI-ஐ மிகவும் சிறிய form factor-க்கு கொண்டு வருகிறது

Cloud-க்கு அந்த பணிகளை மீண்டும் அனுப்புவதற்குப் பதிலாக, compact devices-லேயே AI workloads-ஐ நேரடியாக இயக்கும் வகையில் வடிவமைக்கப்பட்ட புதிய Coral Board-ஐ Google அறிமுகப்படுத்தியுள்ளது. Google I/O-வில் வெளியிடப்பட்ட இந்த board, நிறுவனத்தின் Coral ecosystem-ஐ மையமாகக் கொண்டு உருவாக்கப்பட்டுள்ளது; latency, connectivity, மற்றும் power constraints காரணமாக on-device processing மிகவும் பயனுள்ளதாக இருக்கும் headphones, AR glasses, மற்றும் smartwatches போன்ற products-ஐ இது இலக்காகக் கொண்டுள்ளது.

முக்கியக் கூற்று நேரடியானது: இந்த board, தனது open-source Gemma 3 270M language model-ஐ முழுமையாக local-ஆக இயக்க முடியும் என்று Google கூறுகிறது. இதனால் raw scale-ஐ விடவும், இது எதை பிரதிநிதித்துவப்படுத்துகிறது என்பதற்காகவே hardware முக்கியத்துவம் பெறுகிறது. Edge AI பெரும்பாலும் fragmented accelerators, குறுகிய memory budgets, மற்றும் பயன்படத்தக்க models-ஐ சிறிய systems-ல் பொருத்தும் நடைமுறைச் சிரமம் ஆகியவற்றால் வரையறுக்கப்பட்டு வந்துள்ளது. அந்த பிரச்சினைக்கு Coral Board-ஐ ஒரு அதிக ஒருங்கிணைந்த பதிலாக Google முன்வைக்கிறது.

Hardware-ல் என்ன இருக்கிறது

Board-இன் மையத்தில் Synaptics Astra SL2619 chip உள்ளது; இதில் 2 GHz dual-core processor, 2 GB RAM, மற்றும் 1 TOPS compute உள்ளது. Board-ல் Coral NPU-வும் உள்ளது என்று Google கூறுகிறது; இது RISC-V architecture-ஐ அடிப்படையாகக் கொண்ட open-source machine learning unit ஆகும், மேலும் Google Research மூலம் உருவாக்கப்பட்டது.

இந்த specifications, headline performance-ஐ விட efficiency மற்றும் integration முக்கியமான class-இல் இந்த device-ஐ நிறுத்துகின்றன. Google இதை desktop-class AI machine என நிலைநிறுத்தவில்லை. பதிலாக, audio, vision, அல்லது text-ஐ நேரடியாக device-இலேயே interpret செய்ய வேண்டிய hardware-க்கான developer-friendly building block-ஆக இதை நிலைநிறுத்துகிறது.

Local inference ஏன் முக்கியம்

Gemma 3-ஐ local-ஆக இயக்குவது, persistent cloud connection இல்லாமலும் சில பணிகளை ஒரு device கையாள முடியும் என்பதைக் குறிக்கிறது. இது latency-ஐ குறைக்க, responsiveness-ஐ மேம்படுத்த, மற்றும் network reliability-இல் உள்ள சார்பைக் குறைக்க முடியும். மேலும், சில பயன்பாடுகளில் செலவு அமைப்பையும் மாற்றுகிறது; ஏனெனில் ஒவ்வொரு முறையும் user பேசும்போதோ, gesture செய்தபோதோ, அல்லது translation கோரும்போதோ, inference-ஐ remote service-க்கு அனுப்ப வேண்டிய அவசியம் இல்லை.

Google-இன் சொந்த demonstrations இதே திசையைக் காட்டுகின்றன. I/O-வில், நிறுவனம் real-time translation, voice-controlled hardware, மற்றும் YOLOv8 vision model jellyfish இயக்கத்தை track செய்து அதை music-ஆக மாற்றிய generative music setup-ஐக் காட்டியது. இவை அனைத்தும், இந்த board வெறும் model demos-க்கு மட்டுமல்ல, sensors, inference, மற்றும் output-ஐ real time-இல் இணைக்கும் interactive systems-க்குமானது என்பதைக் காட்டுவதற்காகவே அமைக்கப்பட்டவை.

Accelerator fragmentation-ஐ குறைக்கும் முயற்சி

Google-இன் விளக்கத்தின் மிகவும் சுவாரசியமான பகுதியிலொன்று, AI accelerators-இல் உள்ள fragmentation-க்கு இது ஒரு தீர்வு எனப் பார்ப்பது. Wearables, smart devices, மற்றும் embedded systems போன்ற வகைகளில் products உருவாக்கும் developers-க்கு இது உண்மையான தடையாகும். Models கோட்பாட்டில் பொருந்தலாம்; ஆனால் deployment பெரும்பாலும் incompatible toolchains, hardware quirks, மற்றும் குறுகிய vendor support காரணமாக தடுமாறுகிறது.

ஒரு open-source NPU approach-ஐ அறியப்பட்ட model family-உம் public demos-உம் சேர்த்தことで, edge stack-ஐ மேலும் முழுமையானதாக காட்ட Google முயற்சி செய்கிறது. இது thermal limits, battery use, அல்லது memory ceilings தொடர்பான கடின tradeoffs-ஐ நீக்குவதில்லை. ஆனால் local AI-ஐ ஒரு showcase feature-இலிருந்து மீண்டும் மீண்டும் பயன்படுத்தக்கூடிய development path-ஆக மாற்றுவதற்கான ஒரு தீவிரமான முயற்சியை இது சுட்டிக்காட்டுகிறது.

Developers-க்கு இதன் பொருள் என்ன

இந்த board இந்த summer-இல் ship ஆகும் என்று எதிர்பார்க்கப்படுகிறது, ஆனால் pricing-ஐ Google அறிவிக்கவில்லை. இதனால் மிகப் பெரிய நடைமுறை கேள்விகளில் ஒன்று இன்னும் திறந்த நிலையில் உள்ளது. Small-device AI hardware, prototypes-ஐத் தாண்டி செல்லும் அளவுக்கு மலிவாகவும், அணுகக்கூடியதாகவும், programming-க்கு எளிதாகவும் இருக்க வேண்டும்.

அப்படியிருந்தாலும், இந்த product edge AI எங்கு செல்கிறது என்பதைக் குறித்து முக்கியமான ஒன்றைக் கூறுகிறது. ஒரு வருடத்திற்கு முன்பு, AI hardware பற்றிய பல உரையாடல்கள் பெரும்பாலும் giant clusters மற்றும் data centers-ஐ மையமாகக் கொண்டிருந்தன. சந்தையின் அந்த பகுதி இன்னமும் ஆதிக்கம் செலுத்துகிறது. ஆனால் Google-இன் புதிய board, AI buildout-இல் மற்றொரு front இருப்பதை நினைவூட்டுகிறது: cloud inference-ஐ தொடர்ந்து சார்ந்து இருக்காமல், சிறிய devices-க்கு போதுமான local intelligence கொடுத்து அவை மேலும் autonomous-ஆகவும், பயனுள்ளதாகவும் மாற்றுவது.

எது அதிகமாகத் தெரிகிறது

  • Gemma 3 270M, cloud support இல்லாமல் board-இல் இயங்குகிறது.
  • Hardware glasses, headphones, மற்றும் wearables போன்ற compact products-ஐ இலக்காக்கிறது.
  • Fragmented accelerator choices-இடையே edge AI development-ஐ எளிதாக்கும் வழியாக Google இந்த board-ஐ நிலைநிறுத்துகிறது.

Platform affordable-ஆகவும், software stack stable-ஆகவும் இருந்தால், Coral Board ஒரு demo unit-ஐ விட அதிகமாக மாறக்கூடும். அது, எப்போதும் home-க்கு call செய்ய வேண்டியதில்லாத, everyday devices-க்குள் வாழும் AI-க்கான ஒரு நடைமுறைப் படியாக இருக்கலாம்.

இந்தக் கட்டுரை The Decoder அளித்த செய்திப்படிப்பின் அடிப்படையில் தயாரிக்கப்பட்டது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on the-decoder.com