DeepL நேரடி குரல் மொழிபெயர்ப்பு தொகுப்பு மற்றும் API-யை அறிமுகப்படுத்துகிறது

DeepL எழுத்து மொழிபெயர்ப்பில் மட்டும் நிற்க விரும்பவில்லை

உரை மொழிபெயர்ப்புக்குப் பெயர்பெற்ற DeepL, ஒரு voice-to-voice மொழிபெயர்ப்பு தொகுப்பையும், நிறுவனங்களுக்கும் டெவலப்பர்களுக்கும் புதிய API-யையும் அறிமுகப்படுத்தியுள்ளது. இந்த நகர்வு, நிறுவனத்தின் நிலையான உரை மற்றும் ஆவண தயாரிப்புகளைத் தாண்டி, நேரடி பேச்சு உரையாடல்களுக்குள் நுழைகிறது; அங்கு latency, துல்லியம், பயன்பாட்டு வசதி ஆகியவை மிகவும் கடினமான சிக்கல்களாகின்றன.

வழங்கப்பட்ட மூல உரையின் படி, இந்த புதிய தொகுப்பு கூட்டங்கள், மொபைல் மற்றும் இணைய உரையாடல்கள், மேலும் முன்நிலை பணியாளர்களுக்கான தனிப்பயன் செயலிகளின் மூலம் குழு விவாதங்களுக்காக வடிவமைக்கப்பட்டுள்ளது. வெளியக டெவலப்பர்கள் மற்றும் நிறுவனங்கள் தங்களுடைய சொந்த செயலாக்கங்களை உருவாக்க DeepL ஒரு API-யையும் வெளியிடுகிறது; அதில் call center போன்ற பயன்பாட்டு நிலைகளும் அடங்கும்.

குரல் ஏன் கேட்பதை விட பெரிய தாவல்

DeepL CEO Jarek Kutylowski, TechCrunch-க்கு பேசியபோது, உரை மற்றும் ஆவண மொழிபெயர்ப்பை பல ஆண்டுகள் மேம்படுத்திய பிறகு குரல் ஒரு இயல்பான அடுத்த படி என்று கூறினார். ஆனால் நிறுவனத்தின் சொந்த விளக்கம், குரல் என்பது வெறும் ஆடியோ இணைக்கப்பட்ட உரை மொழிபெயர்ப்பு அல்ல என்பதைத் தெளிவாக்குகிறது. Kutylowski, முக்கிய சவால்களில் ஒன்று குறைந்த latency-யையும் துல்லியமான வெளியீட்டையும் சமநிலைப்படுத்துவது என்று கூறினார். அந்த சமநிலை முழு தயாரிப்பு வகையின் மையமாக உள்ளது.

மொழிபெயர்க்கப்பட்ட ஆடியோ மிகவும் தாமதமாக வந்தால், உரையாடல் சிதறிவிடும். அது வேகமாக வந்தாலும் துல்லியமில்லை என்றால், நம்பிக்கை உடைந்துவிடும். எனவே நேரடி மொழிபெயர்ப்பு என்பது மிக நெருக்கமான செயல்பாட்டு வரம்பை சார்ந்தது. தொழில்நுட்ப தரம் பயனர்கள் நேரடி தொடர்பில் உடனடியாக உணரும் வகையில் இருக்கும் சந்தையில் DeepL நுழைகிறது; அது ஒரு ஆவணம் முடிந்த பிறகல்ல.

EU hits Google with €890 million DMA fine

The European Commission fined Alphabet for two Digital Markets Act violations tied to Google Search and the Play Store, and ordered changes within 60 days.

Read article

DeepL முதலில் எதை நோக்கி செல்கிறது

வழங்கப்பட்ட உரை பல தெளிவான பயன்பாட்டு பாதைகளை சுட்டுகிறது. DeepL ஆரம்ப அணுகல் திட்டத்தின் கீழ் Zoom மற்றும் Microsoft Teams-க்கு கூடுதல்களை வெளியிடுகிறது. அங்கு கேட்பவர்கள் பிறர் தங்களின் சொந்த மொழிகளில் பேசும்போது மொழிபெயர்க்கப்பட்ட ஆடியோவை கேட்கலாம் அல்லது திரையில் காட்டப்படும் மொழிபெயர்க்கப்பட்ட உரையைப் பின்தொடரலாம்.

நேரடி அல்லது தொலை உரையாடல்களுக்கான மொபைல் மற்றும் இணைய தயாரிப்பையும் நிறுவனம் வழங்குகிறது. பணிமனைப் பயிற்சி அல்லது பயிற்சி அமர்வுகள் போன்ற குழு சூழல்களுக்கு, பங்கேற்பாளர்கள் QR code மூலம் சேர முடியும் என்று DeepL கூறுகிறது. இந்த விவரம் முக்கியமானது, ஏனெனில் இது நிறுவனம் தனது இலக்குகளை நிர்வாகக் கூட்டங்கள் அல்லது ஒருவருக்கொருவர் premium பயன்பாடுகளுக்கே மட்டுப்படுத்தவில்லை என்பதை காட்டுகிறது. பலரும் பகிர்ந்து பயன்படும் மொழிபெயர்ப்பு அடுக்கு தேவைப்படும் செயல்பாட்டு சூழல்களையும் அது குறிவைக்கிறது.

DeepL தனது குரல் தொழில்நுட்பம் தொழில் சார்ந்த சொற்கள் மட்டுமல்லாமல், நிறுவனம் மற்றும் தனிப்பட்ட பெயர்களையும் உள்ளடக்கிய தனிப்பயன் சொற்பதங்களை கற்றுக்கொண்டு தழுவிக்கொள்ள முடியும் என்றும் கூறுகிறது. தனிப்பட்ட தொழில்நுட்ப சொற்கள் அதிகமாக இருக்கும் வணிக சூழல்களில் இது தீர்மானிக்கக்கூடிய திறனாக இருக்கலாம்.

வணிக காரணம் வசதியைத் தாண்டியது

DeepL இந்த தயாரிப்பை ஒரு தொடர்பு கருவி மட்டுமல்ல, உலகளாவிய செயல்பாடுகளுக்கான அடுக்குசார் infrastructure ஆகவும் நிலைநிறுத்துகிறது. அடுத்த சில ஆண்டுகளில் AI வாடிக்கையாளர் சேவை எப்படியிருக்கும் என்பதை மாற்றுகிறது என்று Kutylowski TechCrunch-க்கு கூறினார். மேலும், தகுதியான பணியாளர்களை நியமிப்பது கடினமோ செலவோ அதிகமோ இருக்கும் மொழிகளில் ஆதரவை வழங்க மொழிபெயர்ப்பு அடுக்கு நிறுவனங்களுக்கு உதவும் என்றும் வாதிட்டார்.

இந்தக் கூற்று ஒரு பரந்த பொருளாதார காரணத்தைச் சுட்டுகிறது. குரல் மொழிபெயர்ப்பு அணுகக்கூடிய சந்தைகளை விரிவாக்கலாம், பகிர்ந்த குழுக்களில் இடையூறுகளை குறைக்கலாம், மேலும் வாடிக்கையாளர் ஆதரவு பணியமர்த்தலை மாற்றக்கூடும். வழங்கப்பட்ட பொருளில் விலை விவரங்கள், செயல்திறன் அளவுகள், அல்லது வாடிக்கையாளர் ஏற்றுக் கொள்ளும் எண்ணிக்கைகள் இல்லை; ஆகவே அந்த வணிக விளைவுகள் இன்னும் நிரூபிக்கப்படவில்லை. ஆனால் திசை தெளிவாக உள்ளது: DeepL குரலை ஒரு துணை அம்சமாக அல்ல, enterprise மொழி infrastructure-க்கான புதிய வளர்ச்சி மேடையாகப் பார்க்கிறது.

Two drones, one yellow, one grey, almost identical otherwise.

FCC moves toward retroactive ban on suspected DJI front companies

The U.S. communications regulator is preparing to use a new enforcement tool against companies it says disguised DJI products to keep them on the American market.

Read article

முழு stack-ஐ கட்டுப்படுத்துதல்

மூல உரையில் DeepL முழு voice-to-voice stack-ஐ கட்டுப்படுத்துகிறது என்று கூறப்படுகிறது. இந்த பகுதி மேலும் விவரிக்கப்படவில்லை என்றாலும், அந்தக் கூற்று itself மிகச் சொல்லாடல் நிறைந்தது. இது நிறுவனம் ஒரே model component-இல் அல்ல, system integration-இல் போட்டியிட விரும்புகிறது என்பதைக் காட்டுகிறது. நேரடி மொழிபெயர்ப்பில் இது முக்கியம், ஏனெனில் பயனர் அனுபவம் speech recognition, language translation, voice generation, delivery timing ஆகியவை ஒன்றாக எவ்வாறு வேலை செய்கின்றன என்பதையே சாரும்.

அந்த pipeline-இன் அதிகப் பகுதியை own செய்யும் நிறுவனம் naturalness, speed, accuracy ஆகியவற்றுக்கிடையிலான trade-off-களை நன்றாக tune செய்ய முடியும். அது மேலாதிக்கத்துக்கு உத்தரவாதமல்ல; ஆனால் DeepL குரலை வெறும் தற்போதைய software-க்கு AI speech tools இணைப்பது அல்ல, product architecture சவாலாகக் கருதுகிறது என்பதை இது காட்டுகிறது.

சிறப்பு brand-க்கு அர்த்தமுள்ள விரிவாக்கம்

DeepL-ன் reputation பெரும்பாலும் உரை தரத்தில்தான் கட்டமைக்கப்பட்டுள்ளது. இந்த launch, அந்த நம்பகத்தன்மை நேரடி பேச்சு தொடர்பிலும் நீடிக்குமா என்பதைச் சோதிக்கிறது; அங்கு பயனர்கள் குறைவாகவே பொறுமை காட்டுவர், product failure உடனடியாகத் தெரியும். கூட்டங்கள், பணிமனைகள், ஆதரவு சூழல்கள் ஆகியவை ஆவண மொழிபெயர்ப்பை விட கடினமான சோதனைத் தளமாகின்றன, ஏனெனில் software மனித உரையாடலின் வேகத்தோடு ஒத்திசைவாக இருக்க வேண்டும்.

என்றாலும், இந்த நகர்வு தந்திர ரீதியாக ஒத்திசைவானது. AI ஒரு அம்சத்தை platform-ஆக மாற்ற முடியும் என்பதை காட்ட translation நிறுவனங்கள் அழுத்தத்தில் உள்ளன. கூட்டங்கள், மொபைல் உரையாடல்கள், குழு அமர்வுகள், மற்றும் வெளிப்புற API ஆகியவற்றில் voice products-ஐ வழங்குவதன் மூலம், DeepL ஒரு பரந்த language interface provider ஆக மாற விரும்புகிறது.

வழங்கப்பட்ட மூல உரை ஒரு எளிய ஆனால் முக்கியமான முடிவை ஆதரிக்கிறது: DeepL இனி பயனர்கள் ஏற்கனவே எழுதியதை மட்டும் மொழிபெயர்ப்பதில் திருப்தியில்லை. அது இப்போது உரையாடலின் உள்ளேயே இருக்க விரும்புகிறது. அதன் CEO குறிப்பிட்ட latency மற்றும் துல்லிய சமநிலையை அது நிர்வகிக்க முடிந்தால், அந்த மாற்றம் enterprise தொடர்புகளில் நிறுவனத்தின் பங்கைக் குறிப்பிடத்தக்க அளவில் விரிவாக்கலாம்.

இந்தக் கட்டுரை TechCrunch செய்தியறிக்கையை அடிப்படையாகக் கொண்டது. மூல கட்டுரையைப் படிக்கவும்.

$A fractured image of a person speaking into a microphone.$

Sony expands Udio fight with new lawsuit over 30,000 songs

Sony Music has filed a new lawsuit accusing Udio of infringing more than 30,000 songs, escalating one of the most consequential copyright fights around generative AI music.

Read article

Originally published on techcrunch.com