DeepL ला फक्त लिखित भाषांतरावर थांबायचे नाही

टेक्स्ट ट्रान्सलेशनसाठी ओळखल्या जाणाऱ्या DeepL ने व्हॉइस-टू-व्हॉइस ट्रान्सलेशन सूट आणि व्यवसायांसाठी तसेच डेव्हलपर्ससाठी नवीन API सुरू केली आहे. या पावलामुळे कंपनी तिच्या स्थापित टेक्स्ट आणि डॉक्युमेंट उत्पादनांपासून प्रत्यक्ष वेळेत होणाऱ्या बोलक्या संभाषणांकडे विस्तारत आहे, जिथे latency, accuracy आणि usability अधिक कठीण समस्या बनतात.

दिलेल्या मूळ मजकुरानुसार, ही नवीन सूट मीटिंग्ज, मोबाईल आणि वेब संभाषणे, तसेच फ्रंटलाइन कर्मचाऱ्यांसाठी कस्टम अॅप्सद्वारे समूह चर्चांसाठी डिझाइन केली आहे. DeepL एक APIही देत आहे, ज्यामुळे बाहेरील डेव्हलपर्स आणि कंपन्यांना स्वतःची अंमलबजावणी तयार करता येईल; यात call center सारखे use casesही आहेत.

व्हॉइस इतके सोपे का नाही जितके ऐकायला वाटते

DeepL चे CEO Jarek Kutylowski यांनी TechCrunch ला सांगितले की टेक्स्ट आणि डॉक्युमेंट ट्रान्सलेशनमध्ये वर्षानुवर्षे केलेल्या सुधारांनंतर व्हॉइस हा नैसर्गिक पुढचा टप्पा होता. पण कंपनीच्या स्वतःच्या वर्णनावरून स्पष्ट होते की व्हॉइस म्हणजे फक्त ऑडिओ जोडलेले टेक्स्ट ट्रान्सलेशन नाही. Kutylowski यांनी सांगितले की मुख्य आव्हानांपैकी एक कमी latency आणि अचूक output यांच्यात समतोल साधणे आहे. हा trade-off संपूर्ण product category च्या केंद्रस्थानी आहे.

अनुवादित ऑडिओ उशिरा आला तर संभाषण तुटते. तो वेगाने आला, पण चुकीचा असेल, तर विश्वास ढासळतो. त्यामुळे real-time translation एका अरुंद operational margin वर अवलंबून असते. DeepL अशा बाजारात प्रवेश करत आहे जिथे तांत्रिक गुणवत्ता वापरकर्त्यांना live interactionमध्ये लगेच जाणवते; नंतर एखादा दस्तऐवज वाचून नाही.