programmable voice-க்கான விரிவான முயற்சி

Google தனது generative audio வழங்கலை Gemini 3.1 Flash text-to-speech மூலம் விரிவாக்குகிறது; இதனை நிறுவனம் இதுவரை தனது மிகவும் இயல்பான மற்றும் வெளிப்பாட்டுத்தன்மை மிகுந்த speech system என்று விவரிக்கிறது. The Decoder வெளியிட்ட இந்த புதுப்பிப்பு raw voice quality மட்டும் அல்ல, controllability-யையும் கவனத்தில் கொள்கிறது; இதனால் developers generated speech எப்படிச் звучит என்பதை நேரடியாக வடிவமைக்க மேலும் வழிகள் பெறுகின்றனர்.

முக்கிய அம்சம் audio tags என்ற அமைப்பு: style, tempo, tone, accent ஆகியவற்றை பயனர்கள் வழிநடத்த text commands. இது முக்கியம், ஏனெனில் text-to-speech-இல் நீண்டகால பிரச்சினை என்பது ஒலியை நிஜமானதாக மாற்றுவது மட்டும் அல்ல, product தேவைகளுடன் பொருந்தும் வகையில் நம்பகமாக வெளிப்பாட்டுடன் உருவாக்குவதும் ஆகும். Assistants, narrated explainers, customer-service flows, கல்வி உள்ளடக்கம், மற்றும் dialog-heavy applications—all வெவ்வேறு pacing மற்றும் vocal styles-இல் பயன் பெறுகின்றன.

இந்த கட்டுப்பாடுகளை எளிய text instructions ஆக வெளிப்படுத்துவதன் மூலம், prompt design மற்றும் voice output இடையிலான friction-ஐ Google குறைக்கிறது போல தெரிகிறது. Tone மற்றும் delivery-யை opaque model behavior ஆகக் கருதுவதற்குப் பதிலாக, platform அவற்றை developers திட்டமிட்டு பாதிக்கக்கூடிய parameters ஆக முன்வைக்கிறது.

மொழி பரவல் மற்றும் multi-speaker ஆதரவு

அறிக்கையின் படி, Gemini 3.1 Flash TTS 70-க்கும் மேற்பட்ட மொழிகளை ஆதரிக்கிறது மற்றும் multi-speaker dialogs உருவாக்க முடியும். இந்த இரண்டு திறன்களும் model-ஐ ஆங்கில demo-களுக்கு மட்டுமல்ல, உலகளாவிய products மற்றும் மேலும் சிக்கலான media workflows-க்கும் பொருத்தமாக்குகின்றன.

AI voice-இல் மொழி ஆதரவு அதிகமாக ஒரு competitive differentiator ஆகிறது. பல applications-க்கு ஒரு model family பல markets-க்கு சேவை செய்ய வேண்டும்; region-specific providers-ன் patchwork தேவைப்படக் கூடாது. Multi-speaker dialog support கூட பயனுள்ளது, ஏனெனில் conversational lessons, dramatized narration, மற்றும் short-form media-க்கான synthetic host exchanges போன்ற richer formats-க்கு வழி திறக்கிறது.

இந்த சேர்க்கை Google developer tooling மற்றும் enterprise deployment இரண்டையும் நோக்கமாகக் கொண்டுள்ளது என்பதைக் காட்டுகிறது. Gemini API, enterprise users-க்கான Vertex AI, Workspace users-க்கான Google Vids, மற்றும் free experimentation-க்கான AI Studio ஆகிய வழிகளில் கிடைப்பது இதை மேலும் உறுதிப்படுத்துகிறது. product prototyping மற்றும் production channels இரண்டிலும் ஒரே நேரத்தில் நிலைநிறுத்தப்படுகிறது.