Maschinelle Übersetzung und generative KI – Teil 2: die Nachteile

Kategorien: KI Maschinelle Übersetzung Autor: Amelie Aichinger

Nachteile der maschinellen Übersetzung

Bereits in meinem letzten Beitrag im Februar ging es in einer kurzen Einführung in das Thema maschinelle Übersetzung und generative künstliche Intelligenz (KI) in der Übersetzung um die Vorteile dieser Technologien. Denn sie sind in unserer modernen, stark vernetzten Welt zweifellos wichtige Helfer!

Diesen Monat soll es jedoch um ihre Nachteile gehen. Natürlich könnten Sie mir als ausgebildeter Übersetzerin nun eine gewissen Befangenheit unterstellen, aber es geht mir in diesem Beitrag gar nicht darum, diese neuen Technologien schlechtzureden. Vielmehr möchte ich auf all die kleinen Dinge aufmerksam zu machen, die bei der Vermarktung von maschineller Übersetzung und generativer KI gerne einmal nicht erwähnt werden bzw. die vielen Menschen gar nicht bewusst sind.

(Inspiriert zu dieser Beitragsreihe hat mich übrigens folgender Artikel: „Amazon Researchers Find ‚Shocking Amount‘ of Faulty Machine Translations in the Web“ (nur auf Englisch verfügbar). Hier wird berichtet, dass sich Mitarbeiter der Forschungsgruppe KI von Amazon um die Qualität von maschineller Übersetzung sorgen. Der Grund dafür: die große Menge KI-generierter Texte oder bereits maschinell übersetzter Texte, die teils stark fehlerbehaftet sind, aber für das Training neuer Übersetzungs-Engines genutzt werden.)

Problematik

Im Folgenden habe ich mir erlaubt, die verschiedenen Problematiken, die sich im Zusammenhang mit maschineller Übersetzung ergeben können, in drei Teilbereiche zu gliedern: die Übersetzung von Texten, die Übersetzung gesprochener Sprache (maschinelles Dolmetschen) und allgemeine Probleme, die ihrerseits noch einmal in sprachliche und technische Aspekte untergliedert sind.

Übersetzung von Texten

Genauigkeit: der Teufel steckt im Detail

Gerne gestehe ich, dass die Qualität maschineller Übersetzungen in den letzten Jahren einen großen Sprung gemacht hat. Die Einführung neuronaler Netzwerke führt zu bestechend guten Übersetzungen, gerade in den „großen“ Sprachen wie Englisch, Deutsch, Französisch oder Spanisch. Doch gerade hier liegt die Gefahr. Aufgrund der auf den ersten Blick hohen Qualität werden kleinere Fehler und Fehlübersetzungen gerne übersehen. Gerade sie können aber die Bedeutung eines Textes wesentlich verändern. Besonders gefährlich ist die Verwendung also, wenn man die Zielsprache, in die übersetzt wird, nicht flüssig oder zumindest sehr gut spricht: Nuancen werden dann noch schneller übersehen oder fehlerhafte Texte in gutem Glauben einfach aus der Software übernommen.

Tippfehler

Die meisten Texte sind heute nach wie vor menschengemacht. Und Menschen machen Fehler – unter anderem auch Rechtschreib- oder Grammatikfehler. Korrekturprogramme sind heute zwar schon sehr gut, erkennen aber nicht immer jeden Fehler (insbesondere wenn ein falsch geschriebenes Wort ein legitimes anderes Wort ergibt). Im schlimmsten Fall können sie sogar den Sinn eines Textes verändern. Eine Maschine hinterfragt das aber nicht – ein guter Übersetzer schon.

Fehlender Blick für das große Ganze

Maschinelle Übersetzungs-Tools teilen Texte in Abschnitte auf, die sie dann verarbeiten. Das sind meist einzelne Sätze. Das bedeutet, dass die Übersetzung Satz für Satz neu berechnet wird – und führt zu kuriosen Dingen. So kann ein und dasselbe Wort in drei Sätzen auf drei unterschiedliche Weisen übersetzt werden, weil das jeweilige Wort der Maschine in diesem Fall gerade als geeigneter erscheint. Für die Konsistenz und damit Verständlichkeit eines Texts ist das ein großes Problem.

Übersetzung gesprochener Sprache

Sprache zu Text, Übersetzung, Text zu Sprache

Schon der Arbeitsablauf einer maschinellen Verdolmetschung birgt seine Tücken. Nach heutigem Stand sind Maschinen noch nicht in der Lage, Gesprochenes in einer Sprache direkt in Gesprochenes in einer anderen Sprache umzuwandeln. Vielmehr wird zunächst das Gesprochene in Text umgewandelt, der von einer Maschine (genau wie bei normalen Texten) übersetzt und dann per Sprachausgabe wieder in Gesprochenes übertragen wird. Gerade der erste Schritt, die Verschriftlichung des Gesprochenen, ist sehr fehleranfällig, wie man gerne auch bei automatisch erstellten Untertiteln beobachten kann. Und wenn bereits die Grundlage fehlerhaft ist, kann auch die maschinell verdolmetschte Version nicht korrekt sein.

(Anmerkung: Das heißt nicht zwangsläufig, dass eine Verständigung unmöglich ist. Aber in Situationen, in denen es auf Nuancen ankommt – wie bei Geschäftsverhandlungen – kann das ein Problem sein.)

Dialekte und Akzente

Nicht jeder deutschsprachige Mensch spricht lupenreines Hochdeutsch. Und so schön diese regionalen Einfärbungen und Ausdrücke sind, so problematisch sind sie für Maschinen. Diese tun sich häufig sehr schwer damit, Dialekte und Akzente zu verstehen. Bei starken Akzenten oder Dialekten kann es sogar so weit kommen, dass die Maschine den Menschen gar nicht mehr versteht, und kann das Gesagte somit auch nicht übersetzen.

Stimmmodulation

Die Kommunikation per gesprochenem Wort ist jedoch viel mehr als nur die Worte selbst, die wir sagen. Auch die Stimmlage spielt eine sehr große Rolle. Mit ihr können wir vermitteln, wie wir uns fühlen, unseren Worten Nachdruck verleihen, oder unserem Gegenüber mitteilen, was wir von dem Gesagten halten. Menschliche Dolmetscher versuchen, diese Emotionen auch in der übersetzten Version zu übermitteln, eine maschinelle Sprachausgabe kann dies jedoch zum jetzigen Zeitpunkt noch nicht – zumal dies auch im Arbeitsablauf der maschinellen Verdolmetschung gar nicht vorgesehen ist. Es gehen auf diesem Weg also Informationen verloren, die für die zwischenmenschliche Verständigung wesentlich sein können.

Sprachfluss

Auch der Fluss eines Gesprächs kann für Probleme sorgen. Gerade in Situationen, wo die maschinelle Verdolmetschung für eine anderssprachige Person genutzt wird, und alle anderen Personen eine gemeinsame Verhandlungssprache teilen, kann es zu gegenseitigen Unterbrechungen kommen. In diesem Fall unterscheidet die Maschine jedoch nicht zwischen den Sprecherinnen und Sprechern, sodass der die Dolmetschtechnologie nutzende Person potenziell eine sehr verwirrende Übersetzung ausgegeben wird.

Versprecher

Genau wie Tippfehler können auch Versprecher zu verwirrenden oder gar sinnändernden Situationen führen, die zu Missverständnissen führen.

Allgemeine Probleme

Technische Aspekte:

Bias der Trainingsdaten

Systeme für maschinelle Übersetzungen benötigen im sogenannten Training riesige Datenmengen, um eine gute Übersetzungsqualität liefern zu können. Leider beinhalten diese Daten in den meisten Fällen leider aber auch bestimmte Vorurteile, die die Maschine somit lernt – zumal sie keine Möglichkeit hat, die Inhalte zu hinterfragen und auf ihre Eignung im gesellschaftlichen Kontext zu prüfen. So kommt es unter anderem zu Problemen, in denen beispielsweise weiblich ausgedrückte Formulierungen in Übersetzung negativer dargestellt werden.

Auch bei generativer KI zeigen sich solche „Biases“, wie diese Vorurteile aufgrund der hineingefütterten Daten genannt werden: So fällt beispielsweise auf, dass maskulin formulierte Prompts (Eingabeaufforderungen) bei generativer KI häufig erfolgreichere Ergebnisse liefern. (Gehört im Deutschlandfunk-Podcast „KI verstehen“ – sehr zu empfehlen!)

Datenschutz

Ein sehr großes Problem, dass vielen Menschen wahrscheinlich nicht wirklich bewusst ist, ist das Thema Datenschutz. Die Nutzungsbedingungen der meisten Anbieter maschineller Übersetzungen sehen vor, dass alle eingegebenen Daten vom Unternehmen weiterverwendet werden dürfen (obwohl es bei Bezahlmodellen Ausnahmen gibt). Das bedeutet: Mitarbeiterinnen und Mitarbeiter, die nichtsahnend Firmengeheimnisse in ein maschinelles Übersetzungs-Tool eingeben, legen diese Geheimnisse dem Anbieter des Tools offen.

Rechenleistung und Internetverbindung

Neuronale Netzwerke sind hochkomplexe Systeme und verlangen eine hohe Rechenleistung. Deshalb verwenden die meisten Nutzerinnen und Nutzer Systeme, die nicht lokal auf einem Rechner laufen. Das bedeutet jedoch wiederum, dass sie auf einen funktionierenden Internetzugang angewiesen sind – denn: ohne Internet keine Übersetzung. Sollte also mitten in einer Verhandlung der Strom oder das Internet ausfallen, kann es zu einem Zusammenbruch der Kommunikation kommen.

Sprachliche Aspekte:

Terminologie und Konsistenz

Wer schon einmal einen Blick in ein Wörterbuch geworfen hat, weiß, dass die wenigsten Wörter eins zu eins übersetzt werden können. Meistens gibt es für jedes Wort mehrere Entsprechungen, die je nach Kontext verwendet werden. Da maschinelle Übersetzungs-Tools jedoch mit riesigen Datenmengen trainiert werden und somit viele verschiedene Übersetzungsmöglichkeiten kennenlernen, ist es schwierig, sie zur Verwendung bestimmter Fachbegriffe zu „zwingen“. Unter Umständen kamen diese Fachbegriffe in den Trainingsdaten nicht einmal vor. Außerdem kommt es durch die vielen Wahlmöglichkeiten sehr häufig dazu, dass ein Wort nicht immer gleich übersetzt wird (wie oben unter „Fehlender Blick für das große Ganze“ schon einmal angesprochen).

Ein wichtiger Aspekt sind hier auch Eigennamen. Handelt es sich dabei um offensichtlich ausgedachte Wörter, erkennt ein Übersetzungs-Tool das heute meist. Handelt es sich jedoch um eine Wortschöpfung, die im normalen Sprachgebrauch vorkommen könnte, wird dieses Wort einfach mitübersetzt.

Grammatik

Auch die Grammatik stellt ein potenzielles Problem dar. In der Sprachkombination Englisch-Deutsch sind häufig zweigeteilte Verben eine große Herausforderungen. Verbbausteine, die erst am Satzende kommen, werden oft vergessen oder ausgelassen. Auch Sprachen wie das Polnische stellen interessante Herausforderungen: Hier unterscheidet man anhand des Verbs zwischen männlich/weiblich bzw. maskulin/feminin. Hier besteht ein hohes Risiko, denn wenn das Zielpublikum falsch angesprochen wird, kann es sich schnell vor den Kopf gestoßen fühlen.

Menschliches

Was die zwischenmenschliche Kommunikation für Maschinen so schwierig gestaltet ist genau das: das Menschliche. Die Übersetzung von Ironie und Sarkasmus ist nahezu unmöglich, besonders in der maschinellen Verdolmetschung, in der die Hinweise in der Stimmlage vollständig verloren gehen. Auch Wortspiele ergeben bei direkter Übersetzung keinen Sinn mehr und auch bei mehrdeutigen Aussagen kann es zu Falschübertragungen kommen.

Außerdem ist ein wichtiger Aspekt dessen, wie wir etwas formulieren, an wen wir unseren Text oder unsere Rede richten. Eine Maschine unterscheidet allerdings nicht zwischen Zielgruppen und Kommunikationsanlässen, sondern folgt unbeirrt ihrer Programmierung. Ein Kulturverständnis können wir ihr somit nicht abverlangen.

Fazit

Wenn Sie sich durch diesen langen Beitrag gequält haben, möchte ich Ihnen meine ehrliche Anerkennung aussprechen! Bei der ursprünglichen Materialsammlung hatte ich selbst nicht erwartet, dass ein halbes Buchkapitel daraus werden würde.

Aber das zeigt wieder einmal, wie vieler Aspekte wir uns in unserer täglichen Kommunikation nicht bewusst sind. Und Unterbewusstes findet selten Beachtung. Deshalb war es mir wichtig, auf die potenziellen Fehlerquellen maschineller Übersetzungen hinzuweisen.

Damit möchte ich jedoch keinesfalls sagen, dass sie keine Daseinsberechtigung haben. Im Gegenteil gibt es viele Szenarien, in denen maschinelle Übersetzung nicht nur nützlich, sondern ihr Einsatz auch berechtigt ist. Welche das sind, möchte ich in meinem nächsten Beitrag im April beleuchten.