Als Google kürzlich die Pixel Buds – kabellose Ohrhörer mit Google Assistent – vorstellte, sorgte vor allem ein Feature für große Aufregung: Die Pixel Buds ermöglichen eine gesprochene Echtzeit-Übersetzung in viele Sprachen! Dabei ist dieses Feature nicht wirklich neu und nur ein Höhepunkt von vielen, die momentan im Bereich der maschinellen Übersetzung zu beobachten sind. Wir betrachten deshalb, was aktuell schon möglich ist – und was nicht.

Der persönliche Simultanübersetzer für die Hosentasche

Um noch einmal auf Googles Ohrhörer zurückzukommen: Google bietet mit Google Translate schon lange eine automatische Übersetzung von Texten, wobei die Ergebnisse bislang eher mittelmäßig waren. Diese Übersetzungen ließen sich wenig später auch vorlesen. Mit dem sprachgesteuerten Google Assistent kam die Möglichkeit hinzu, nicht nur geschriebenen Text einzugeben, sondern auch Gesprochenes erkennen und übersetzen zu lassen. In der Summe gibt es die Möglichkeit, Texte zu sprechen und von Google in Echtzeit übersetzen und vorlesen zu lassen, also schon eine Weile. Neu an den Pixel Buds ist eigentlich nur, dass dieses Feature hier geschickt mit Hardware kombiniert und mit einigem Marketingaufwand der Öffentlichkeit vorgestellt wurde. Verdenken kann man es Google aber natürlich nicht, dass sie dieses fraglos beeindruckende Feature nun auch als eigenständiges Produkt verkaufen.

Maschinen lernen Verstehen und Sprechen

Wenden wir uns wieder der geschriebenen Sprache zu: Die Entwicklungen dort mögen zwar auf den ersten Blick nicht so spektakulär sein, sind bei näherer Betrachtung aber noch beeindruckender. Denn die allgegenwärtigen Zauberworte „KI„, „neurale Netze“ und „Deep Learning“ sind auch im Bereich der Machine Translation (maschinellen Übersetzung) angekommen und haben dort – wie überall – zu einem echten Entwicklungssprung geführt.

Bestes Beispiel ist das Kölner Start-up DeepL, das schon seit Jahren mit der Übersetzungs-Website Linguee im Internet aktiv ist. DeepL hat einen eigenen Deep Learning-Ansatz entwickelt und verwendet sogenannte Convolutional Neural Networks (Convnets). Dazu betreibt die Firma in Island (wo der Strom günstig ist) einen extrem leistungsstarken Supercomputer. Mit 5,1 Petaflops kann dieser Rechner eine Million Worte in weniger als einer Sekunde übersetzen. Das war aber nur der erste Schritt. Im nächsten musste die Software die verschiedenen Sprachen lernen. Dazu wurde eine riesige Menge mehrsprachiger Texte benötigt, anhand derer das Programm lernen konnte, wie Sprache funktioniert, Grammatik und Satzstrukturen zu analysieren und Textinhalte unabhängig von der Sprache zu verstehen sind. DeepL konnte dabei auf die Ressourcen von Linguee zurückgreifen, wo bereits große Mengen mehrsprachiger Texte vorhanden waren. Das Ergebnis ist ein kostenloses Tool ähnlich Google Translate, mit dem Text in beliebigen Sprachpaarungen zwischen Englisch, Deutsch, Französisch, Spanisch, Italienisch, Niederländisch und Polnisch übersetzt werden kann. Weitere Sprachen (Mandarin, Japanisch und Russisch) sollen demnächst folgen.

Was bringt es in der Praxis?

Hat sich dieser enorme technische Aufwand gelohnt? Vergleicht man die Übersetzungsqualität von DeepL mit der maschinellen Übersetzung von Google Translate, ist der Unterschied enorm. Google übersetzt (zumindest gefühlt) Wort für Wort und erzeugt damit Texte, die je nach Qualität des Ausgangstextes zwischen verständlich und völlig wirr rangieren. Fehlerfrei sind die Übersetzungen selten, von einer natürlichen, menschlichen Sprache sind sie weit entfernt. Bei einfachen Texten ist es mit Google Translate möglich, sich einen Überblick über den Inhalt zu machen, anspruchsvolle bleiben meist unverständlich. Für mehr reicht die Qualität einfach nicht aus.

google
Bei einfachen Texten liefert Google verständliche, wenn auch nicht optimale Ergebnisse. © Screenshot translate.google.com

 

Demgegenüber sind die Übersetzungen von DeepL, zumindest mit den von uns getesteten Texten, wesentlich besser. Die Satzstrukturen wirken natürlicher, es fließen Floskeln und sehr menschliche Formulierungen in den Text ein und Fachtermini werden korrekt übertragen. Natürlich sind auch diese Übersetzungen nicht frei von Fehlern: Gerade wenn es um Aufzählungen oder Stichpunkte geht, finden sich häufig Begriffe, die zwar eine mögliche Übersetzung sind, in diesem Kontext aber nicht passen. Sobald es sich aber um längere Texte handelt, scheint DeepL, ähnlich wie ein menschlicher Übersetzer, den Kontext zu verstehen und verwendet die korrekten Übersetzungen.

deepl
Die Unterschiede zwischen Google und Deepl sind bei diesem einfachen Beispiel gering. Interessant wird es bei anspruchsvolleren Texten. © Screenshot deepl.com

Ein spannendes Thema. Ein heikles Thema.

DeepL ist nicht der einzige Versuch, lernende Computerprogramme für Übersetzungen zu nutzen. Google, Microsoft und Facebook versuchen damit ihren Anwendungen ein besseres Textverständnis anzutrainieren. Und auch hinter den Kulissen der Übersetzungsbranche arbeiten einige Firmen schon mit dieser Technik. Es wird zum Beispiel versucht, Software auf Kunden zu trainieren, damit sie eine festgelegte Terminologie oder einen bestimmten Sprachstil verwendet. Im Idealfall kann der Computer dann einfache Texte wie Produktbeschreibungen selbst übersetzen. Oder zumindest soweit vorübersetzen, dass der menschliche Übersetzer den Text nur noch kontrollieren und ggf. korrigieren muss. Das ist nicht nur technisch eine Herausforderung, sondern auch rechtlich eine Gratwanderung. Ein Kunde, der für einen menschlichen Übersetzer bezahlt, erwartet natürlich eine entsprechende Dienstleistung. Und spätestens wenn es um die Einhaltung von Übersetzungsnormen (ISO 17100) geht, muss die Frage gestellt werden, wie die Qualitätssicherung bei maschineller Übersetzung umgesetzt werden soll. Ein heikles Thema, über das sicher noch heiß diskutiert werden wird.

Was kann Machine Translation? Und was nicht?

Trotz aller Begeisterung über das bereits Erreichte muss man festhalten: Noch ist die Qualität maschineller Übersetzung nicht so hoch, dass man die Texte ungeprüft kommerziell nutzen kann.

Zumal der Trend in letzter Zeit genau in die Gegenrichtung geht: Seit Jahren lautet das Credo „Content is King“. Und damit ist mehr und mehr hochwertiger Content gemeint. Wer viel Zeit in Premium-Inhalte steckt, kann und will sie nicht von einer unausgereiften Technik in andere Sprachen übersetzen lassen. Gerade hier sind erfahrene menschliche Übersetzer gefragt, die Texte sprachlich und fachlich korrekt übertragen und dabei auch an die Erwartungen und Gewohnheiten der Zielmärkte anpassen – Stichwort zielgruppengerechte Ansprache.

Außerdem kann ein Mensch ganz bewusst den Stil eines Textes beeinflussen: Handelt es sich um einen werblichen Text, der den Leser emotional ansprechen und mitreißen soll? Oder eher um einen Gebrauchstext, der neutral und präzise formuliert werden muss? Dafür ist es auch zwingend notwendig, die Unter- und Zwischentöne des Textes verstehen zu können. Wird hier eine Botschaft „zwischen den Zeilen“ versteckt? Wird jemand zitiert oder auf etwas Bestimmtes Bezug genommen? Wird Sprache kreativ gebraucht, zum Beispiel für Wortspiele oder Wortneuschöpfungen, die gerade im Marketingbereich weit verbreitet sind? Jaroslaw Kutylowski, Chief Technology Officer von DeepL, hat dazu in einem Interview gesagt, dass unter anderem auch journalistische Texte eine große Herausforderung darstellen, weil diese häufig Metaphern und andere Stilmittel enthalten, die sich nur schwer übersetzen lassen. Denn in all diesen Fällen sind Transferleistungen notwendig, die von Computern momentan noch nicht erbracht werden können.

Zusätzlich stellt sich auch die Frage der Wirtschaftlichkeit: Für rechtliche Texte, Marketing- und Werbetexte, CMS-Seiten, Software- und Warenkorbtexte ist MT ohnehin wohl eher nicht geeignet. Produktbeschreibungen lassen sich auch jetzt schon mit Unterstützung von Translation-Memory-Technologie durch geeignete muttersprachliche Übersetzer vergleichweise günstig übersetzen. Maschinelle Übersetzungen, die von muttersprachlichen Fachübersetzern geprüft und ggf. korrigiert werden müssen, bieten in solchen Fällen eher keinen finanziellen Vorteil.

Wo geht die Reise hin?

Sicherlich wird sich Machine Translation in nächster Zeit erste Nischen erschließen. Wie schon erwähnt, kann es dazu genutzt werden, Übersetzungsvorschläge zu erstellen und damit menschlichen Übersetzern die Arbeit zu erleichtern. Zumindest bei solchen Textsorten, die keinen hohen kreativen Anspruch haben und keine verschiedene Bedeutungsebenen enthalten. Wer allerdings anspruchsvolle Texte übersetzen lassen möchte oder bei sicherheits- oder haftungsrelevanten Textsorten Wert auf Fehlerfreiheit legt, wird auch auf absehbare Zeit mit einem muttersprachlichen Fachübersetzer am besten beraten sein.

Wie steht Eurotext zum Thema Machine Translation?

Wir beobachten die Entwicklungen mit großem Interesse, aber auch mit einer gesunden Portion Skepsis. Momentan setzen wir deshalb keine solchen Technologien ein. Stattdessen setzen wir weiterhin auf unsere serverbasierte Übersetzungsumgebung, bewährte Translation-Memory-Technologie und Fach- und Keyword-Termbanken, mit denen unsere muttersprachlichen und kundenspezifisch konsolidierten Länderteams arbeiten. Wir können uns aber vorstellen, geeignete Machine-Translation-Technologie zumindest als Unterstützung für unsere Übersetzer einzusetzen. Wenn es soweit ist, werden wir das unseren Partnern und Kunden gegenüber natürlich transparent machen.

Quellen:

 

autor_eurotext_100Autor: Eurotext Redaktion

Wir erklären, wie Internationalisierung funktioniert, geben Tipps zu Übersetzungsprojekten und erläutern Technologien und Prozesse. Außerdem berichten wir über aktuelle E-Commerce-Entwicklungen und befassen uns mit Themen rund um Sprache.