DeepL تطلق حزمة ترجمة صوتية فورية وواجهة API

تريد DeepL أن تمتلك أكثر من مجرد الترجمة المكتوبة

أطلقت DeepL، المعروفة أساسًا بترجمة النصوص، حزمة ترجمة من صوت إلى صوت وواجهة API جديدة موجهة إلى الشركات والمطورين. هذه الخطوة توسع نطاق الشركة من منتجات النصوص والوثائق التي رسخت مكانتها إلى محادثات منطوقة في الوقت الفعلي، حيث تصبح الكمون والدقة وسهولة الاستخدام مشكلات أصعب بكثير.

وفقًا للنص المصدر المقدم، صُممت الحزمة الجديدة للاجتماعات والمحادثات عبر الهاتف والويب، والمناقشات الجماعية للعاملين في الخطوط الأمامية عبر تطبيقات مخصصة. كما تطلق DeepL أيضًا API تمكّن المطورين والشركات الخارجية من بناء تطبيقاتهم الخاصة، بما في ذلك حالات استخدام مثل مراكز الاتصال.

لماذا تمثل الترجمة الصوتية قفزة أكبر مما تبدو عليه

قال الرئيس التنفيذي لـ DeepL، جارِك كوتيلوفسكي، لموقع TechCrunch إن الصوت كان الخطوة التالية الطبيعية بعد سنوات من تحسين ترجمة النصوص والوثائق. لكن وصف الشركة نفسه يوضح أن الصوت ليس مجرد نص مرفق بصوت. وقال كوتيلوفسكي إن أحد التحديات الرئيسية هو الموازنة بين الكمون المنخفض والمخرجات الدقيقة. وهذه المفاضلة هي جوهر فئة المنتج بأكملها.

إذا وصل الصوت المترجم ببطء شديد، تتعطل المحادثة. وإذا وصل بسرعة لكنه غير دقيق، تنهار الثقة. لذلك تعتمد الترجمة الفورية على هامش تشغيلي ضيق. تدخل DeepL سوقًا تظهر فيه الجودة التقنية للمستخدمين فورًا أثناء التفاعل المباشر، بدلًا من الحكم عليها لاحقًا في مستند.

Truth Social ستبيع وصولا عبر API في الوقت الفعلي إلى الحسابات الأبرز

تقول Trump Media إنها ستطلق في 1 أغسطس واجهة Truth Social API مدفوعة، تمنح العملاء تسليمًا خلال أجزاء من الثانية لمنشورات الحسابات الأبرز وإمكانية الوصول إلى الأرشيف حتى عام 2022.

Read article

أين تستهدف DeepL البداية

يشير النص المقدم إلى عدة قنوات نشر عملية. تطلق DeepL إضافات لـ Zoom وMicrosoft Teams ضمن برنامج وصول مبكر. في هذه الأدوات، يمكن للمستمعين إما سماع الصوت المترجم بينما يتحدث الآخرون بلغاتهم الأصلية، أو متابعة النص المترجم على الشاشة.

وتوفر الشركة أيضًا منتجًا للهاتف المحمول والويب للمحادثات المباشرة أو عن بُعد. وفي البيئات الجماعية مثل ورش العمل أو جلسات التدريب، تقول DeepL إن المشاركين يمكنهم الانضمام عبر رمز QR. وهذه التفاصيل مهمة لأنها تُظهر أن طموحات الشركة لا تقتصر على اجتماعات التنفيذيين أو الاستخدام المتميز الفردي. بل إنها تستهدف أيضًا البيئات التشغيلية التي تحتاج فيها عدة أطراف إلى طبقة ترجمة مشتركة.

وتقول DeepL كذلك إن تقنيتها الصوتية يمكنها تعلم وتكييف مفردات مخصصة، بما في ذلك المصطلحات الخاصة بالصناعة وأسماء الشركات والأشخاص. وقد تكون هذه القدرة حاسمة في البيئات التجارية التي تتعثر فيها الترجمة العامة غالبًا أمام اللغة المتخصصة.

القيمة التجارية تتجاوز مجرد الراحة

تطرح DeepL المنتج ليس فقط كأداة تواصل، بل أيضًا كطبقة بنية تحتية للعمليات العالمية. وقال كوتيلوفسكي لـ TechCrunch إن الذكاء الاصطناعي يغير شكل خدمة العملاء خلال السنوات القليلة المقبلة، واعتبر أن طبقة الترجمة يمكن أن تساعد الشركات على تقديم الدعم بلغات يصعب أو يكلف كثيرًا توظيف موظفين مؤهلين لها.

هذا الادعاء يشير إلى منطق اقتصادي أوسع. يمكن للترجمة الصوتية أن توسع الأسواق القابلة للخدمة، وتقلل الاحتكاك في الفرق الموزعة، وربما تعيد تشكيل هيكلة فرق دعم العملاء. ولا يقدم النص المقدم أسعارًا أو معايير أداء أو أرقامًا لاعتماد العملاء، لذا تبقى هذه النتائج التجارية غير مثبتة. لكن الاتجاه واضح: ترى DeepL أن الصوت ليس ميزة جانبية، بل سطح نمو جديد لبنية اللغة المؤسسية.

Night sky reveals Milky Way above Turkiye’s Yozgat forest

مقترح منحة من OMB يثير رد فعل عنيفًا من المدافعين عن علوم الفضاء

أثار اقتراح لائحة اتحادية للمنح رد فعلًا عامًا غير معتاد في حجمه، وجلب تحذيرات من المدافعين عن سياسة الفضاء الذين يقولون إنه قد يعيد تشكيل كيفية تمويل العلوم الأمريكية ومشاركتها.

Read article

التحكم في المكدس الكامل

يقول النص إن DeepL تتحكم في المكدس الكامل للترجمة من صوت إلى صوت. ورغم أن المقتطف ينقطع قبل تفصيل هذه النقطة، فإن الادعاء بحد ذاته دال. فهو يشير إلى أن الشركة تريد المنافسة على تكامل النظام، لا على مكون واحد فقط من النموذج. وفي الترجمة الفورية، قد يكون ذلك مهمًا لأن تجربة المستخدم تعتمد على كيفية عمل التعرف على الكلام والترجمة وتوليد الصوت وتوقيت التسليم معًا.

وقد تكون الشركة التي تملك جزءًا أكبر من هذه السلسلة في وضع أفضل لضبط المفاضلات بين الطبيعية والسرعة والدقة. وهذا لا يضمن التفوق، لكنه يدل على أن DeepL تتعامل مع الصوت بوصفه تحديًا في معمارية المنتج، لا مجرد إضافة أدوات صوتية بالذكاء الاصطناعي إلى برنامجها القائم.

توسع مهم لعلامة متخصصة

بُنيت سمعة DeepL إلى حد كبير على جودة النص. ويختبر هذا الإطلاق ما إذا كانت تلك المصداقية قادرة على الانتقال إلى التفاعل المنطوق المباشر، حيث يكون المستخدمون أقل تسامحًا ويظهر فشل المنتج فورًا. فالمؤتمرات وورش العمل وبيئات الدعم تمثل ساحة اختبار أشد قسوة من ترجمة المستندات، لأن البرنامج يجب أن يواكب سرعة المحادثة البشرية.

ومع ذلك، فإن الخطوة منسجمة استراتيجيًا. تواجه شركات الترجمة ضغطًا لإثبات أن الذكاء الاصطناعي يمكنه تحويل الميزة إلى منصة. ومن خلال تقديم منتجات صوتية عبر الاجتماعات والمحادثات الهاتفية والجلسات الجماعية وواجهة API خارجية، تسعى DeepL إلى أن تصبح مزودًا أوسع لواجهة اللغة.

يدعم النص المصدر المقدم استنتاجًا بسيطًا لكنه مهم: لم تعد DeepL تكتفي بترجمة ما كتبه المستخدمون بالفعل. إنها تريد الآن أن تكون داخل المحادثة نفسها. وإذا تمكنت من تحقيق التوازن بين الكمون والدقة الذي أشار إليه الرئيس التنفيذي، فقد يوسع ذلك دور الشركة في الاتصال المؤسسي بشكل ملحوظ.

هذه المقالة مبنية على تقرير TechCrunch. اقرأ المقال الأصلي.

مراجعة Joolca Hottap Go: دش محمول بقيمة 700 دولار للمغامرين

Joolca Hottap Go هو نظام ماء ساخن محمول متكامل للتخييم وحياة الشاحنات والعمل في الهواء الطلق. بسعر 554 دولارًا بالإضافة إلى بطارية اختيارية، يوفر الراحة والرفاهية لكن بتكلفة عالية.

Read article

Originally published on techcrunch.com

DeepL تتجاوز النص إلى ترجمة صوتية فورية

تريد DeepL أن تمتلك أكثر من مجرد الترجمة المكتوبة

لماذا تمثل الترجمة الصوتية قفزة أكبر مما تبدو عليه

Truth Social ستبيع وصولا عبر API في الوقت الفعلي إلى الحسابات الأبرز

أين تستهدف DeepL البداية

القيمة التجارية تتجاوز مجرد الراحة

مقترح منحة من OMB يثير رد فعل عنيفًا من المدافعين عن علوم الفضاء

التحكم في المكدس الكامل

توسع مهم لعلامة متخصصة

مراجعة Joolca Hottap Go: دش محمول بقيمة 700 دولار للمغامرين

Comments (0)

Related Articles

ميتا تواجه غرامة أوروبية بقيمة 12 مليار دولار بسبب خلاصات إنستغرام وفيسبوك الإدمانية

Keep Reading