DeepL veut maîtriser bien plus que la traduction écrite
DeepL, surtout connue pour la traduction de texte, a lancé une suite de traduction de voix à voix et une nouvelle API destinée aux entreprises et aux développeurs. Cette initiative fait évoluer la société de ses produits établis de texte et de documents vers des conversations parlées en temps réel, où la latence, la précision et la facilité d’utilisation deviennent des problèmes bien plus complexes.
Selon le texte source fourni, la nouvelle suite est conçue pour les réunions, les conversations mobiles et web, ainsi que pour les discussions de groupe destinées aux travailleurs de première ligne via des applications personnalisées. DeepL lance également une API afin que des développeurs et des entreprises externes puissent créer leurs propres implémentations, y compris pour des cas d’usage comme les centres d’appels.
Pourquoi la voix constitue un saut plus grand qu’il n’y paraît
Le PDG de DeepL, Jarek Kutylowski, a déclaré à TechCrunch que la voix était l’étape suivante naturelle après des années passées à améliorer la traduction de textes et de documents. Mais la propre description de l’entreprise montre clairement que la voix n’est pas simplement du texte accompagné d’audio. Kutylowski a indiqué que l’un des principaux défis consiste à trouver un équilibre entre faible latence et sortie précise. Ce compromis est au cœur de toute cette catégorie de produits.
Si l’audio traduit arrive trop tard, la conversation se brise. S’il arrive vite mais de manière imprécise, la confiance s’effondre. La traduction en temps réel dépend donc d’une marge de manœuvre opérationnelle très étroite. DeepL entre sur un marché où la qualité technique est vécue immédiatement par les utilisateurs dans l’interaction en direct, plutôt qu’évaluée après coup dans un document.


