DeepL రియల్-టైమ్ వాయిస్ ట్రాన్స్‌లేషన్ సూట్ మరియు APIని ప్రారంభించింది

DeepL రాత అనువాదంతో మాత్రమే సంతృప్తి చెందడం లేదు

టెక్స్ట్ ట్రాన్స్‌లేషన్‌కి ప్రసిద్ధి చెందిన DeepL, ఒక వాయిస్-టు-వాయిస్ ట్రాన్స్‌లేషన్ సూట్‌తో పాటు వ్యాపారాలు మరియు డెవలపర్ల కోసం కొత్త APIని విడుదల చేసింది. ఈ మార్పు సంస్థను దాని స్థిరపడిన టెక్స్ట్, డాక్యుమెంట్ ఉత్పత్తుల నుంచి రియల్-టైమ్ మాట్లాడే సంభాషణల వైపుకు విస్తరిస్తోంది, అక్కడ latency, accuracy, usability చాలా కఠినమైన సమస్యలుగా మారతాయి.

ఇచ్చిన మూల పాఠ్యం ప్రకారం, ఈ కొత్త సూట్ మీటింగులు, మొబైల్ మరియు వెబ్ సంభాషణలు, అలాగే ఫ్రంట్‌లైన్ వర్కర్ల కోసం కస్టమ్ యాప్‌ల ద్వారా గ్రూప్ డిస్కషన్ల కోసం రూపొందించబడింది. DeepL ఒక APIని కూడా విడుదల చేస్తోంది, దాంతో బయట డెవలపర్లు, కంపెనీలు తమ స్వంత అమలులను నిర్మించుకోవచ్చు; ఇందులో కాల్ సెంటర్లు వంటి use cases కూడా ఉన్నాయి.

వాయిస్ అనిపించినంత సులభమైన దూకుడు ఎందుకు కాదు

DeepL CEO Jarek Kutylowski TechCrunchకి మాట్లాడుతూ, టెక్స్ట్ మరియు డాక్యుమెంట్ ట్రాన్స్‌లేషన్‌ను సంవత్సరాలుగా మెరుగుపరిచిన తర్వాత వాయిస్ సహజమైన తదుపరి దశ అని అన్నారు. కానీ కంపెనీ స్వంత వివరణ వాయిస్ అంటే కేవలం ఆడియో కలిపిన టెక్స్ట్ ట్రాన్స్‌లేషన్ కాదని స్పష్టం చేస్తోంది. Kutylowski, ముఖ్య సవాళ్లలో ఒకటి తక్కువ latencyతో ఖచ్చితమైన outputను సమతుల్యం చేయడం అని చెప్పారు. ఆ trade-off మొత్తం product categoryకి కేంద్రబిందువు.

అనువదించిన ఆడియో చాలా ఆలస్యంగా వస్తే, సంభాషణ చెదిరిపోతుంది. అది వేగంగా వచ్చి, కానీ తప్పైతే, నమ్మకం కూలిపోతుంది. కాబట్టి real-time translation ఒక సంకుచిత ఆపరేషనల్ పరిధిపై ఆధారపడి ఉంటుంది. DeepL live interactionలో వినియోగదారులు వెంటనే అనుభవించే marketలోకి ప్రవేశిస్తోంది; తర్వాత పత్రంలో చూసి అంచనా వేయే మార్కెట్ కాదు.

EU Googleపై €890 million DMA జరిమానా విధించింది

Google Search మరియు Play Storeకు సంబంధించిన రెండు Digital Markets Act ఉల్లంఘనలపై యూరోపియన్ కమిషన్ Alphabetకు జరిమానా విధించి, 60 రోజుల్లో మార్పులు చేయాలని ఆదేశించింది.

Read article

DeepL మొదట ఎక్కడ దృష్టి పెడుతోంది

ఇచ్చిన పాఠ్యం అనేక స్పష్టమైన deployment channelsని సూచిస్తోంది. DeepL ప్రారంభ access program కింద Zoom మరియు Microsoft Teams కోసం add-onsను విడుదల చేస్తోంది. ఆ toolsలో, వినియోగదారులు ఇతరులు తమ భాషల్లో మాట్లాడుతుండగా translated audio వినవచ్చు లేదా తెరపై translated textను అనుసరించవచ్చు.

కంపెనీ in-person లేదా remote conversations కోసం mobile, web productను కూడా అందిస్తోంది. workshops లేదా training sessions వంటి group settingsలో, QR code ద్వారా పాల్గొనవచ్చని DeepL చెబుతోంది. ఈ వివరానికి ప్రాముఖ్యత ఉంది, ఎందుకంటే ఇది సంస్థ తన లక్ష్యాలను executive meetings లేదా one-on-one premium use casesకి మాత్రమే పరిమితం చేయడం లేదని చూపిస్తోంది. అనేక మంది పాల్గొనాల్సిన shared translation layer అవసరమయ్యే operational settingsను కూడా అది లక్ష్యంగా పెట్టుకుంది.

DeepL తన వాయిస్ టెక్నాలజీ పరిశ్రమ-సంబంధిత పదాలతో పాటు company, personal names వంటి custom vocabularyని నేర్చుకుని అనుకూలించగలదని కూడా చెబుతోంది. ప్రత్యేక భాషా పదజాలం ఎక్కువగా ఉండే వ్యాపార సందర్భాల్లో ఇది కీలకమైన సామర్థ్యం కావచ్చు.

వ్యాపార కారణం సౌలభ్యాన్ని మించి ఉంది

DeepL ఈ ఉత్పత్తిని కేవలం communication toolగా కాక, global operations కోసం ఒక infrastructure layerగా కూడా ఉంచుతోంది. వచ్చే కొన్ని సంవత్సరాల్లో AI customer service ఎలా మారుతుందో అని Kutylowski TechCrunchకి చెప్పారు, మరియు translation layer qualified staffని నియమించడం కష్టమో ఖరీదైనదో అయ్యే భాషలలో support అందించడానికి కంపెనీలకు సహాయపడగలదని వాదించారు.

ఆ వ్యాఖ్య broader economic rationaleని సూచిస్తోంది. వాయిస్ ట్రాన్స్‌లేషన్ addressable marketsని విస్తరించగలదు, distributed teamsలో frictionను తగ్గించగలదు, మరియు customer support staffingను తిరిగి రూపకల్పన చేయగలదు. ఇచ్చిన materialలో pricing, performance benchmarks, లేదా customer adoption figures లేవు, కాబట్టి ఆ commercial outcomes ఇంకా నిరూపితం కాలేదు. అయినప్పటికీ దిశ స్పష్టంగా ఉంది: DeepL వాయిస్‌ని side featureగా కాకుండా enterprise language infrastructureకి కొత్త growth surfaceగా చూస్తోంది.

పూర్తి stackపై నియంత్రణ

మూల పాఠ్యం DeepL మొత్తం voice-to-voice stackను నియంత్రిస్తుందని చెబుతోంది. ఆ excerpt దాన్ని ఇంకా విస్తరించకపోయినా, ఆ దావా itself చాలా సూచనాత్మకం. ఒకే model componentపై కాకుండా system integrationపై పోటీ చేయాలని కంపెనీ కోరుకుంటోందని ఇది సూచిస్తుంది. రియల్-టైమ్ ట్రాన్స్‌లేషన్‌లో ఇది ముఖ్యమైనది, ఎందుకంటే user experience speech recognition, language translation, voice generation, delivery timing అన్నీ కలిసి ఎలా పనిచేస్తాయన్నదానిపై ఆధారపడి ఉంటుంది.

ఆ pipelineలో ఎక్కువ భాగాన్ని own చేసే కంపెనీ naturalness, speed, accuracyల మధ్య trade-offsను మెరుగ్గా tune చేయగలదు. అది superiorityకి గ్యారెంటీ ఇవ్వదు, కానీ DeepL వాయిస్‌ని కేవలం ప్రస్తుత softwareకి AI speech toolsను జోడించడంలా కాకుండా product architecture సవాలుగా చూస్తోందని సూచిస్తుంది.

ప్రత్యేక brandకి అర్థవంతమైన విస్తరణ

DeepL ప్రతిష్ఠ ప్రధానంగా text qualityపై నిర్మితమైంది. ఈ launch, ఆ విశ్వసనీయత live spoken interactionలో కొనసాగుతుందా అనే పరీక్ష. అక్కడ వినియోగదారులు తక్కువ సహనం చూపుతారు, product failure వెంటనే కనిపిస్తుంది. meetings, workshops, support environments document translation కంటే కఠినమైన proving groundలు, ఎందుకంటే software human conversation వేగాన్ని అనుసరించాలి.

అయినప్పటికీ, ఈ move వ్యూహాత్మకంగా సుసంగతమైనదే. AI ఒక featureను platformగా మార్చగలదని చూపించాలనే ఒత్తిడి translation కంపెనీలపై ఉంది. meetings, mobile conversations, group sessions, మరియు external APIలో వాయిస్ ఉత్పత్తులను అందించడం ద్వారా DeepL మరింత విస్తృతమైన language interface providerగా మారాలని ప్రయత్నిస్తోంది.

ఇచ్చిన మూల పాఠ్యం ఒక సరళమైన కానీ ముఖ్యమైన నిర్ధారణను మద్దతిస్తోంది: DeepL ఇప్పుడు వినియోగదారులు ఇప్పటికే రాసినదాన్ని మాత్రమే అనువదించడంలో సంతృప్తి చెందడం లేదు. అది ఇప్పుడు సంభాషణలోనే ఉండాలని కోరుకుంటోంది. దాని CEO గుర్తించిన latency మరియు accuracy సమతుల్యాన్ని అది సాధించగలిగితే, ఆ మార్పు enterprise communicationలో కంపెనీ పాత్రను గణనీయంగా విస్తరించగలదు.

ఈ వ్యాసం TechCrunch రిపోర్టింగ్‌పై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.

Originally published on techcrunch.com

DeepL టెక్స్ట్‌ను దాటి, రియల్-టైమ్ వాయిస్ ట్రాన్స్‌లేషన్ వైపు అడుగులు వేస్తోంది