DeepL எழுத்து மொழிபெயர்ப்பில் மட்டும் நிற்க விரும்பவில்லை

உரை மொழிபெயர்ப்புக்குப் பெயர்பெற்ற DeepL, ஒரு voice-to-voice மொழிபெயர்ப்பு தொகுப்பையும், நிறுவனங்களுக்கும் டெவலப்பர்களுக்கும் புதிய API-யையும் அறிமுகப்படுத்தியுள்ளது. இந்த நகர்வு, நிறுவனத்தின் நிலையான உரை மற்றும் ஆவண தயாரிப்புகளைத் தாண்டி, நேரடி பேச்சு உரையாடல்களுக்குள் நுழைகிறது; அங்கு latency, துல்லியம், பயன்பாட்டு வசதி ஆகியவை மிகவும் கடினமான சிக்கல்களாகின்றன.

வழங்கப்பட்ட மூல உரையின் படி, இந்த புதிய தொகுப்பு கூட்டங்கள், மொபைல் மற்றும் இணைய உரையாடல்கள், மேலும் முன்நிலை பணியாளர்களுக்கான தனிப்பயன் செயலிகளின் மூலம் குழு விவாதங்களுக்காக வடிவமைக்கப்பட்டுள்ளது. வெளியக டெவலப்பர்கள் மற்றும் நிறுவனங்கள் தங்களுடைய சொந்த செயலாக்கங்களை உருவாக்க DeepL ஒரு API-யையும் வெளியிடுகிறது; அதில் call center போன்ற பயன்பாட்டு நிலைகளும் அடங்கும்.

குரல் ஏன் கேட்பதை விட பெரிய தாவல்

DeepL CEO Jarek Kutylowski, TechCrunch-க்கு பேசியபோது, உரை மற்றும் ஆவண மொழிபெயர்ப்பை பல ஆண்டுகள் மேம்படுத்திய பிறகு குரல் ஒரு இயல்பான அடுத்த படி என்று கூறினார். ஆனால் நிறுவனத்தின் சொந்த விளக்கம், குரல் என்பது வெறும் ஆடியோ இணைக்கப்பட்ட உரை மொழிபெயர்ப்பு அல்ல என்பதைத் தெளிவாக்குகிறது. Kutylowski, முக்கிய சவால்களில் ஒன்று குறைந்த latency-யையும் துல்லியமான வெளியீட்டையும் சமநிலைப்படுத்துவது என்று கூறினார். அந்த சமநிலை முழு தயாரிப்பு வகையின் மையமாக உள்ளது.

மொழிபெயர்க்கப்பட்ட ஆடியோ மிகவும் தாமதமாக வந்தால், உரையாடல் சிதறிவிடும். அது வேகமாக வந்தாலும் துல்லியமில்லை என்றால், நம்பிக்கை உடைந்துவிடும். எனவே நேரடி மொழிபெயர்ப்பு என்பது மிக நெருக்கமான செயல்பாட்டு வரம்பை சார்ந்தது. தொழில்நுட்ப தரம் பயனர்கள் நேரடி தொடர்பில் உடனடியாக உணரும் வகையில் இருக்கும் சந்தையில் DeepL நுழைகிறது; அது ஒரு ஆவணம் முடிந்த பிறகல்ல.

DeepL முதலில் எதை நோக்கி செல்கிறது

வழங்கப்பட்ட உரை பல தெளிவான பயன்பாட்டு பாதைகளை சுட்டுகிறது. DeepL ஆரம்ப அணுகல் திட்டத்தின் கீழ் Zoom மற்றும் Microsoft Teams-க்கு கூடுதல்களை வெளியிடுகிறது. அங்கு கேட்பவர்கள் பிறர் தங்களின் சொந்த மொழிகளில் பேசும்போது மொழிபெயர்க்கப்பட்ட ஆடியோவை கேட்கலாம் அல்லது திரையில் காட்டப்படும் மொழிபெயர்க்கப்பட்ட உரையைப் பின்தொடரலாம்.

நேரடி அல்லது தொலை உரையாடல்களுக்கான மொபைல் மற்றும் இணைய தயாரிப்பையும் நிறுவனம் வழங்குகிறது. பணிமனைப் பயிற்சி அல்லது பயிற்சி அமர்வுகள் போன்ற குழு சூழல்களுக்கு, பங்கேற்பாளர்கள் QR code மூலம் சேர முடியும் என்று DeepL கூறுகிறது. இந்த விவரம் முக்கியமானது, ஏனெனில் இது நிறுவனம் தனது இலக்குகளை நிர்வாகக் கூட்டங்கள் அல்லது ஒருவருக்கொருவர் premium பயன்பாடுகளுக்கே மட்டுப்படுத்தவில்லை என்பதை காட்டுகிறது. பலரும் பகிர்ந்து பயன்படும் மொழிபெயர்ப்பு அடுக்கு தேவைப்படும் செயல்பாட்டு சூழல்களையும் அது குறிவைக்கிறது.

DeepL தனது குரல் தொழில்நுட்பம் தொழில் சார்ந்த சொற்கள் மட்டுமல்லாமல், நிறுவனம் மற்றும் தனிப்பட்ட பெயர்களையும் உள்ளடக்கிய தனிப்பயன் சொற்பதங்களை கற்றுக்கொண்டு தழுவிக்கொள்ள முடியும் என்றும் கூறுகிறது. தனிப்பட்ட தொழில்நுட்ப சொற்கள் அதிகமாக இருக்கும் வணிக சூழல்களில் இது தீர்மானிக்கக்கூடிய திறனாக இருக்கலாம்.

வணிக காரணம் வசதியைத் தாண்டியது

DeepL இந்த தயாரிப்பை ஒரு தொடர்பு கருவி மட்டுமல்ல, உலகளாவிய செயல்பாடுகளுக்கான அடுக்குசார் infrastructure ஆகவும் நிலைநிறுத்துகிறது. அடுத்த சில ஆண்டுகளில் AI வாடிக்கையாளர் சேவை எப்படியிருக்கும் என்பதை மாற்றுகிறது என்று Kutylowski TechCrunch-க்கு கூறினார். மேலும், தகுதியான பணியாளர்களை நியமிப்பது கடினமோ செலவோ அதிகமோ இருக்கும் மொழிகளில் ஆதரவை வழங்க மொழிபெயர்ப்பு அடுக்கு நிறுவனங்களுக்கு உதவும் என்றும் வாதிட்டார்.

இந்தக் கூற்று ஒரு பரந்த பொருளாதார காரணத்தைச் சுட்டுகிறது. குரல் மொழிபெயர்ப்பு அணுகக்கூடிய சந்தைகளை விரிவாக்கலாம், பகிர்ந்த குழுக்களில் இடையூறுகளை குறைக்கலாம், மேலும் வாடிக்கையாளர் ஆதரவு பணியமர்த்தலை மாற்றக்கூடும். வழங்கப்பட்ட பொருளில் விலை விவரங்கள், செயல்திறன் அளவுகள், அல்லது வாடிக்கையாளர் ஏற்றுக் கொள்ளும் எண்ணிக்கைகள் இல்லை; ஆகவே அந்த வணிக விளைவுகள் இன்னும் நிரூபிக்கப்படவில்லை. ஆனால் திசை தெளிவாக உள்ளது: DeepL குரலை ஒரு துணை அம்சமாக அல்ல, enterprise மொழி infrastructure-க்கான புதிய வளர்ச்சி மேடையாகப் பார்க்கிறது.

முழு stack-ஐ கட்டுப்படுத்துதல்

மூல உரையில் DeepL முழு voice-to-voice stack-ஐ கட்டுப்படுத்துகிறது என்று கூறப்படுகிறது. இந்த பகுதி மேலும் விவரிக்கப்படவில்லை என்றாலும், அந்தக் கூற்று itself மிகச் சொல்லாடல் நிறைந்தது. இது நிறுவனம் ஒரே model component-இல் அல்ல, system integration-இல் போட்டியிட விரும்புகிறது என்பதைக் காட்டுகிறது. நேரடி மொழிபெயர்ப்பில் இது முக்கியம், ஏனெனில் பயனர் அனுபவம் speech recognition, language translation, voice generation, delivery timing ஆகியவை ஒன்றாக எவ்வாறு வேலை செய்கின்றன என்பதையே சாரும்.

அந்த pipeline-இன் அதிகப் பகுதியை own செய்யும் நிறுவனம் naturalness, speed, accuracy ஆகியவற்றுக்கிடையிலான trade-off-களை நன்றாக tune செய்ய முடியும். அது மேலாதிக்கத்துக்கு உத்தரவாதமல்ல; ஆனால் DeepL குரலை வெறும் தற்போதைய software-க்கு AI speech tools இணைப்பது அல்ல, product architecture சவாலாகக் கருதுகிறது என்பதை இது காட்டுகிறது.

சிறப்பு brand-க்கு அர்த்தமுள்ள விரிவாக்கம்

DeepL-ன் reputation பெரும்பாலும் உரை தரத்தில்தான் கட்டமைக்கப்பட்டுள்ளது. இந்த launch, அந்த நம்பகத்தன்மை நேரடி பேச்சு தொடர்பிலும் நீடிக்குமா என்பதைச் சோதிக்கிறது; அங்கு பயனர்கள் குறைவாகவே பொறுமை காட்டுவர், product failure உடனடியாகத் தெரியும். கூட்டங்கள், பணிமனைகள், ஆதரவு சூழல்கள் ஆகியவை ஆவண மொழிபெயர்ப்பை விட கடினமான சோதனைத் தளமாகின்றன, ஏனெனில் software மனித உரையாடலின் வேகத்தோடு ஒத்திசைவாக இருக்க வேண்டும்.

என்றாலும், இந்த நகர்வு தந்திர ரீதியாக ஒத்திசைவானது. AI ஒரு அம்சத்தை platform-ஆக மாற்ற முடியும் என்பதை காட்ட translation நிறுவனங்கள் அழுத்தத்தில் உள்ளன. கூட்டங்கள், மொபைல் உரையாடல்கள், குழு அமர்வுகள், மற்றும் வெளிப்புற API ஆகியவற்றில் voice products-ஐ வழங்குவதன் மூலம், DeepL ஒரு பரந்த language interface provider ஆக மாற விரும்புகிறது.

வழங்கப்பட்ட மூல உரை ஒரு எளிய ஆனால் முக்கியமான முடிவை ஆதரிக்கிறது: DeepL இனி பயனர்கள் ஏற்கனவே எழுதியதை மட்டும் மொழிபெயர்ப்பதில் திருப்தியில்லை. அது இப்போது உரையாடலின் உள்ளேயே இருக்க விரும்புகிறது. அதன் CEO குறிப்பிட்ட latency மற்றும் துல்லிய சமநிலையை அது நிர்வகிக்க முடிந்தால், அந்த மாற்றம் enterprise தொடர்புகளில் நிறுவனத்தின் பங்கைக் குறிப்பிடத்தக்க அளவில் விரிவாக்கலாம்.

இந்தக் கட்டுரை TechCrunch செய்தியறிக்கையை அடிப்படையாகக் கொண்டது. மூல கட்டுரையைப் படிக்கவும்.

Originally published on techcrunch.com