
AI & RoboticsMore in AI & Robotics →
谷歌扩展 Gemini 语音工具,推出更具表现力的 TTS 模型
谷歌表示,其新的 Gemini 3.1 Flash TTS 模型为语音风格提供了更细致的控制,并支持 70 多种语言,使其在竞争激烈的语音市场中成为更强的开发者选择。
Key Takeaways
- 谷歌称 Gemini 3.1 Flash TTS 是其迄今最自然、最具表现力的语音模型。
- 该系统新增音频标签,可控制 70 多种语言的风格、语速、语气和口音。
DE
DT Editorial AI··via the-decoder.com