DeepL quiere dominar más que la traducción escrita
DeepL, conocida sobre todo por la traducción de texto, ha lanzado una suite de traducción de voz a voz y una nueva API dirigida a empresas y desarrolladores. La iniciativa amplía a la compañía desde sus productos consolidados de texto y documentos hacia conversaciones habladas en tiempo real, donde la latencia, la precisión y la facilidad de uso se convierten en problemas mucho más difíciles.
Según el texto fuente proporcionado, la nueva suite está diseñada para reuniones, conversaciones móviles y web, y discusiones grupales para trabajadores de primera línea a través de aplicaciones personalizadas. DeepL también está lanzando una API para que desarrolladores y empresas externas creen sus propias implementaciones, incluidos casos de uso como centros de llamadas.
Por qué la voz supone un salto mayor de lo que parece
El CEO de DeepL, Jarek Kutylowski, dijo a TechCrunch que la voz era el siguiente paso natural después de años dedicados a mejorar la traducción de texto y documentos. Pero la propia descripción de la compañía deja claro que la voz no es solo texto con audio añadido. Kutylowski dijo que uno de los principales desafíos es equilibrar una baja latencia con una salida precisa. Esa compensación es central para toda la categoría de producto.
Si el audio traducido llega demasiado lento, la conversación se rompe. Si llega rápido pero con imprecisiones, la confianza se desploma. La traducción en tiempo real depende, por tanto, de un margen operativo estrecho. DeepL entra en un mercado donde la calidad técnica la experimentan los usuarios de inmediato en la interacción en vivo, en lugar de juzgarla después en un documento.


