DeepL startet Echtzeit-Sprachübersetzungssuite und API

DeepL will mehr als nur geschriebene Übersetzung beherrschen

DeepL, vor allem bekannt für Textübersetzung, hat eine Sprach-zu-Sprach-Übersetzungssuite und eine neue API für Unternehmen und Entwickler gestartet. Damit erweitert das Unternehmen sein etabliertes Angebot für Text- und Dokumentenübersetzung auf gesprochene Echtzeitgespräche, bei denen Latenz, Genauigkeit und Benutzerfreundlichkeit deutlich schwierigere Probleme darstellen.

Laut dem bereitgestellten Quelltext ist die neue Suite für Meetings, mobile und Web-Gespräche sowie Gruppendiskussionen für Frontline-Mitarbeitende über maßgeschneiderte Apps ausgelegt. DeepL veröffentlicht außerdem eine API, damit externe Entwickler und Unternehmen eigene Implementierungen bauen können, einschließlich Anwendungsfällen wie Callcentern.

Warum Sprache ein größerer Sprung ist, als es klingt

DeepL-CEO Jarek Kutylowski sagte gegenüber TechCrunch, Sprache sei der natürliche nächste Schritt nach Jahren der Verbesserung von Text- und Dokumentenübersetzung gewesen. Die eigene Beschreibung des Unternehmens macht jedoch klar, dass Sprache nicht einfach Text mit Audio ist. Kutylowski sagte, eine der größten Herausforderungen sei es, niedrige Latenz mit präziser Ausgabe in Einklang zu bringen. Dieser Zielkonflikt ist zentral für die gesamte Produktkategorie.

Wenn übersetztes Audio zu spät ankommt, bricht das Gespräch zusammen. Kommt es schnell, aber ungenau, bricht das Vertrauen zusammen. Echtzeitübersetzung hängt daher von einem engen operativen Spielraum ab. DeepL betritt einen Markt, in dem technische Qualität von Nutzern unmittelbar in der Live-Interaktion erlebt wird und nicht erst im Nachhinein in einem Dokument bewertet wird.

Photo illustration of Dario Amodei of Anthropic.

Anthropic reicht vertraulich ein, um den IPO-Prozess zu beginnen

Anthropic teilte mit, einen Entwurf der Registrierungsunterlage bei der US-Börsenaufsicht SEC eingereicht zu haben und damit den Weg für einen Börsengang einzuleiten.

Read article

Worauf DeepL zuerst abzielt

Der bereitgestellte Text nennt mehrere konkrete Einsatzkanäle. DeepL bringt Add-ons für Zoom und Microsoft Teams im Rahmen eines Early-Access-Programms heraus. In diesen Tools können Zuhörer entweder übersetztes Audio hören, während andere in ihrer Muttersprache sprechen, oder den übersetzten Text auf dem Bildschirm verfolgen.

Das Unternehmen bietet außerdem ein mobiles und webbasiertes Produkt für persönliche oder entfernte Gespräche an. Für Gruppensettings wie Workshops oder Schulungen können Teilnehmende laut DeepL per QR-Code beitreten. Dieses Detail ist wichtig, weil es zeigt, dass die Ambitionen des Unternehmens nicht auf Vorstandssitzungen oder One-to-One-Premium-Nutzung beschränkt sind. Es zielt auch auf operative Umgebungen, in denen mehrere Teilnehmende eine gemeinsame Übersetzungsebene brauchen.

DeepL sagt zudem, dass seine Sprachtechnologie kundenspezifische Vokabeln lernen und sich daran anpassen kann, einschließlich branchenspezifischer Begriffe sowie Firmen- und Personennamen. Diese Fähigkeit könnte in Geschäftsumgebungen entscheidend sein, in denen generische Übersetzung bei Fachsprache oft versagt.

Der Business Case geht über Bequemlichkeit hinaus

DeepL positioniert das Produkt nicht nur als Kommunikationswerkzeug, sondern auch als Infrastrukturschicht für globale Abläufe. Kutylowski sagte TechCrunch, KI verändere in den kommenden Jahren, wie Kundenservice aussehen könnte, und argumentierte, dass eine Übersetzungsschicht Unternehmen dabei helfen könne, Support in Sprachen anzubieten, für die qualifizierte Mitarbeitende schwer oder teuer zu finden sind.

Diese Aussage verweist auf eine breitere wirtschaftliche Logik. Sprachübersetzung kann adressierbare Märkte erweitern, Reibung in verteilten Teams verringern und möglicherweise die Personalausstattung im Kundensupport neu gestalten. Das bereitgestellte Material nennt jedoch keine Preise, Leistungsbenchmarks oder Kundenzahlen, sodass diese kommerziellen Ergebnisse vorerst unbewiesen bleiben. Die Richtung ist aber klar: DeepL sieht Sprache nicht als Nebenfunktion, sondern als neue Wachstumsfläche für Unternehmens-Sprachinfrastruktur.

I put my smart TV setup behind a router-based VPN and never looked back - here's why

Die Nutzung von VPNs auf Smart-TVs entwickelt sich zu einem Thema der Heimnetzwerk-Sicherheit

Ein routerbasiertes VPN für Smart-TVs wird nicht nur als Mittel für Streaming-Zugriffe beworben, sondern auch als Weg, die Datenexposition über vernetzte Geräte im Haushalt zu verringern.

Read article

Den gesamten Stack kontrollieren

Die Quelle sagt, dass DeepL den gesamten Sprach-zu-Sprach-Stack kontrolliert. Auch wenn der Auszug vor der Ausführung dieses Punktes abbricht, ist die Aussage selbst aufschlussreich. Sie legt nahe, dass das Unternehmen auf Systemintegration statt nur auf eine einzelne Modellkomponente setzen will. Bei Echtzeitübersetzung kann das wichtig sein, weil die Nutzererfahrung davon abhängt, wie Spracherkennung, Übersetzung, Sprachgenerierung und Auslieferungstiming zusammenspielen.

Ein Unternehmen, das mehr von dieser Pipeline besitzt, ist möglicherweise besser positioniert, die Zielkonflikte zwischen Natürlichkeit, Geschwindigkeit und Genauigkeit auszutarieren. Das garantiert keine Überlegenheit, zeigt aber, dass DeepL Sprache als Architekturfrage des Produkts betrachtet und nicht bloß als Anfügen von KI-Sprachtools an bestehende Software.

Eine bedeutsame Erweiterung für eine Spezialmarke

DeepLs Ruf beruht bislang vor allem auf Textqualität. Dieser Start testet, ob sich diese Glaubwürdigkeit auf Live-Gespräche übertragen lässt, in denen Nutzer weniger verzeihen und Produktfehler sofort sichtbar werden. Meetings, Workshops und Support-Umgebungen sind ein härterer Prüfstand als Dokumentenübersetzung, weil die Software dem Tempo menschlicher Gespräche folgen muss.

Strategisch ist der Schritt dennoch stimmig. Übersetzungsunternehmen stehen unter Druck zu zeigen, dass KI aus einer Funktion eine Plattform machen kann. Mit Sprachprodukten für Meetings, mobile Gespräche, Gruppensitzungen und eine externe API will DeepL zu einem breiteren Anbieter sprachlicher Schnittstellen werden.

Der bereitgestellte Quelltext stützt eine einfache, aber wichtige Schlussfolgerung: DeepL will nicht länger nur das übersetzen, was Nutzer bereits geschrieben haben. Das Unternehmen will nun mitten im Gespräch sitzen. Wenn es die vom CEO benannte Balance zwischen Latenz und Genauigkeit beherrscht, könnte dieser Wandel die Rolle des Unternehmens in der Unternehmenskommunikation deutlich vergrößern.

Dieser Artikel basiert auf Berichterstattung von TechCrunch. Zum Originalartikel.

NVIDIA stellt RTX Spark vor, um AI-PCs unter Windows weiter voranzutreiben

NVIDIA hat RTX Spark vorgestellt, einen auf Arm basierenden Windows-PC-Chip, der laut dem Unternehmen bis zu 1 Petaflop an KI-Leistung für Laptops und kompakte Desktop-Rechner liefern kann.

Read article

Originally published on techcrunch.com

DeepL geht mit Echtzeit-Sprachübersetzung über Text hinaus

DeepL will mehr als nur geschriebene Übersetzung beherrschen

Warum Sprache ein größerer Sprung ist, als es klingt

Anthropic reicht vertraulich ein, um den IPO-Prozess zu beginnen

Worauf DeepL zuerst abzielt

Der Business Case geht über Bequemlichkeit hinaus

Die Nutzung von VPNs auf Smart-TVs entwickelt sich zu einem Thema der Heimnetzwerk-Sicherheit

Den gesamten Stack kontrollieren

Eine bedeutsame Erweiterung für eine Spezialmarke

NVIDIA stellt RTX Spark vor, um AI-PCs unter Windows weiter voranzutreiben

Comments (0)

Related Articles

Dell belebt das XPS 13 mit niedrigerem Preis und dünnerem Design wieder

Bericht deutet auf ein Herbst-Update für Apple TV und HomePod mini hin

Steigende Hitze bringt das Verhalten von Tieren durcheinander

Keep Reading