DeepL শুধু লিখিত অনুবাদে সীমাবদ্ধ থাকতে চায় না

টেক্সট ট্রান্সলেশনের জন্য পরিচিত DeepL একটি ভয়েস-টু-ভয়েস ট্রান্সলেশন স্যুট এবং ব্যবসা ও ডেভেলপারদের জন্য নতুন API চালু করেছে। এই পদক্ষেপ কোম্পানিটিকে তার প্রতিষ্ঠিত টেক্সট এবং ডকুমেন্ট পণ্য থেকে সরিয়ে রিয়েল-টাইম মুখের কথোপকথনের দিকে নিয়ে যাচ্ছে, যেখানে latency, accuracy এবং usability আরও কঠিন সমস্যা হয়ে ওঠে।

দেওয়া মূল লেখার অনুযায়ী, নতুন স্যুটটি মিটিং, মোবাইল ও ওয়েব কথোপকথন, এবং ফ্রন্টলাইন কর্মীদের জন্য কাস্টম অ্যাপের মাধ্যমে গ্রুপ আলোচনা পরিচালনার জন্য তৈরি। DeepL একটি API-ও দিচ্ছে, যাতে বাইরের ডেভেলপার ও কোম্পানিগুলো নিজেদের ইমপ্লিমেন্টেশন তৈরি করতে পারে, যার মধ্যে call center-এর মতো use case-ও আছে।

ভয়েস কেন শুনতে যত সহজ লাগে, তত সহজ নয়

DeepL CEO Jarek Kutylowski TechCrunch-কে বলেছেন, টেক্সট ও ডকুমেন্ট ট্রান্সলেশন উন্নত করতে বছরের পর বছর কাজ করার পর ভয়েস ছিল স্বাভাবিক পরবর্তী ধাপ। কিন্তু কোম্পানির নিজস্ব বর্ণনা স্পষ্ট করে যে voice মানে কেবল অডিও-যুক্ত টেক্সট ট্রান্সলেশন নয়। Kutylowski বলেছেন, মূল চ্যালেঞ্জগুলোর একটি হলো কম latency আর নির্ভুল output-এর মধ্যে ভারসাম্য রাখা। এই trade-off পুরো product category-র কেন্দ্রে।

অনূদিত অডিও যদি খুব দেরিতে আসে, তাহলে কথোপকথন ভেঙে যায়। যদি দ্রুত আসে কিন্তু ভুল হয়, তাহলে বিশ্বাস ভেঙে পড়ে। তাই real-time translation একটি সংকীর্ণ operational margin-এর ওপর নির্ভরশীল। DeepL এমন একটি বাজারে ঢুকছে, যেখানে প্রযুক্তিগত গুণমান ব্যবহারকারীরা live interaction-এ সঙ্গে সঙ্গে অনুভব করেন, পরে কোনো নথি দেখে নয়।