DeepL 想掌控的不只是书面翻译
DeepL 以文本翻译著称,如今推出了一套语音互译套件,以及面向企业和开发者的新 API。此举让这家公司从既有的文本和文档产品,扩展到实时口语对话场景,而在这一领域,延迟、准确性和易用性会变成更棘手的问题。
根据所提供的原文,新套件面向会议、移动端和网页对话,以及通过定制应用为一线员工提供的群组讨论场景。DeepL 也在推出一个 API,供外部开发者和公司构建自己的实现方案,包括呼叫中心等用例。
为什么语音比听起来更难跨越
DeepL 首席执行官 Jarek Kutylowski 对 TechCrunch 表示,在多年改进文本和文档翻译之后,语音是一个自然的下一步。不过,公司的描述也清楚表明,语音并不只是给文本翻译加上音频。Kutylowski 说,主要挑战之一是在低延迟与高准确输出之间取得平衡。这种取舍是整个产品类别的核心。
如果翻译后的音频到得太慢,对话就会被打断;如果来得很快但不准确,信任就会崩塌。因此,实时翻译依赖于一个非常狭窄的运行窗口。DeepL 进入的是一个用户会在现场互动中立即感受到技术质量,而不是事后在文档里评判的市场。
DeepL 先瞄准哪里
所提供的文本指出了几个具体的部署渠道。DeepL 正通过早期访问计划,为 Zoom 和 Microsoft Teams 推出插件。在这些工具中,听众可以在他人使用母语发言时收听翻译后的音频,或者在屏幕上查看翻译文本。
该公司还提供一款适用于面对面或远程对话的移动端和网页产品。对于研讨会或培训等群组场景,DeepL 表示参与者可以通过二维码加入。这个细节很重要,因为它表明公司并不只是把目标局限于高管会议或一对一的高端用途,也在面向需要共享翻译层的运营场景。
DeepL 进一步表示,其语音技术可以学习并适应自定义词汇,包括行业术语以及公司和个人姓名。在企业环境中,通用翻译往往会在专业语言上失灵,这种能力可能会成为决定性因素。


