Definition: Wörterbuch
Ein Wörterbuch umfasst Dokumente, die paarweise zugeordnet sind, und gibt Ausdrücke oder Sätze mit ihren entsprechenden Übersetzungen an. Verwenden Sie ein Wörterbuch in Ihrem Training, wenn Translator für alle Instanzen des Ausgangssatzes bzw. -ausdrucks die Übersetzung verwenden soll, die Sie im Wörterbuch angegeben haben. Wörterbücher werden auch als Glossare oder Terminologiedatenbanken bezeichnet. Sie können sich das so vorstellen, dass das Wörterbuch für alle Begriffe, die Sie angeben, den Ansatz „Kopieren und Ersetzen“ verfolgt. Darüber hinaus erstellt der Microsoft Custom Translator-Dienst eigene Universalwörterbücher und verwendet sie, um die Qualität seiner Übersetzung zu steigern. Ein vom Kunden bereitgestelltes Wörterbuch hat jedoch Vorrang und wird zuerst nach Wörtern oder Sätzen durchsucht.
Wörterbücher eignen sich nur für Projekte mit Sprachpaaren, die auf einem vollständig unterstützten allgemeinen neuronalen Netzwerkmodell von Microsoft basieren. Vollständige Liste der Sprachen anzeigen.
Ausdruckswörterbuch
Beim Ausdruckswörterbuch wird die Groß-/Kleinschreibung unterschieden. Es handelt sich um einen exakten Such- und Ersetzungsvorgang. Wenn Sie ein Ausdruckswörterbuch für das Training Ihres Modells verwenden, wird jedes aufgeführte Wort bzw. jeder aufgeführte Ausdruck wie angegeben übersetzt. Der Rest des Satzes wird wie gewohnt übersetzt. Sie können mithilfe eines Ausdruckswörterbuchs Ausdrücke angeben, die nicht mit dem gleichen unübersetzten Ausdruck in den Quell- und Zieldateien übersetzt werden sollen.
Dynamisches Wörterbuch
Mit der Funktion Dynamisches Wörterbuch können Sie Übersetzungen für bestimmte Termini oder Ausdrücke anpassen. Sie definieren benutzerdefinierte Übersetzungen für Ihren eindeutigen Kontext, Ihre Sprache oder bestimmte Anforderungen.
Neuronales Ausdruckswörterbuch
Das neurale Ausdruckswörterbuch erweitert unsere dynamischen Wörterbuch- und Standardwörterbuchfunktionen. Dynamische Wörterbücher und Ausdruckswörterbücher ermöglichen es Ihnen, die Übersetzungsausgabe anzupassen, indem Sie eigene Übersetzungen für bestimmte Termini oder Ausdrücke bereitstellen. Die Funktion „Dynamisches Wörterbuch“ wird mit der Übersetzer-API verwendet, während das neurale Ausdruckswörterbuch mit benutzerdefiniertem Übersetzer aktiviert ist. Das neurale Ausdruckswörterbuch verbessert die Übersetzungsqualität für Sätze, die eine oder mehrere Ausdrucksübersetzungen enthalten, indem das maschinelle Übersetzungsmodell sowohl den Ausdruck als auch den Kontext anpassen lässt. Diese Anpassung erzeugt flüssigere Übersetzungen. Gleichzeitig wird eine hohe Übersetzungsgenauigkeit beibehalten.
Satzwörterbuch
Beim Satzwörterbuch wird die Groß-/Kleinschreibung nicht unterschieden. Im Satzwörterbuch können Sie eine genaue zielsprachliche Übersetzung für einen Ausgangssatz festlegen. Damit eine Übereinstimmung im Satzwörterbuch gefunden wird, muss der gesamte übermittelte Satz dem Wörterbucheintrag in der Ausgangssprache entsprechen. Ein Quellwörterbucheintrag, der auf Interpunktionszeichen endet, wird er während des Abgleichs ignoriert. Wenn die Übereinstimmung nur für einen Teil des Satzes gilt, stimmt der Eintrag nicht überein. Wenn eine Übereinstimmung erkannt wird, wird der zielsprachliche Eintrag des Satzwörterbuchs zurückgegeben.
Training nur mit Wörterbüchern
Sie können ein Modell nur mit Wörterbuchdaten trainieren. Wählen Sie dazu nur das Wörterbuchdokument (oder mehrere Wörterbuchdokumente) aus, das Sie einbinden möchten, und wählen Sie Modell erstellen aus. Da es sich um ein Training handelt, das ausschließlich auf Wörterbuchdaten basiert, ist keine Mindestanzahl von Trainingssätzen erforderlich. Ihr Modell schließt das Training in der Regel schneller ab als ein Standardtraining. Die resultierenden Modelle verwenden die Microsoft-Baselinemodelle zum Übersetzen samt der von Ihnen hinzugefügten Wörterbücher. Sie erhalten keinen Testbericht.
Hinweis
Custom Translator ordnet Wörterbuchdateien nicht zu. Deswegen ist es wichtig, dass Ihre Wörterbuchdokumente gleich viele Sätze/Ausdrücke in der Ausgangs- und in der Zielsprache haben, und dass diese einander genau zugeordnet sind.
Empfehlungen
Wörterbücher sind kein Ersatz für das Trainieren eines Modells mit Trainingsdaten. Um bessere Ergebnisse zu erzielen, wird empfohlen, das System aus Ihren Trainingsdaten lernen zu lassen. Wenn Sätze oder zusammengesetzte Substantive jedoch wörtlich übersetzt werden müssen, verwenden Sie ein Ausdruckswörterbuch.
Verwenden Sie das Ausdruckswörterbuch sparsam. Wenn ein Ausdruck innerhalb eines Satzes ersetzt wird, geht der Kontext dieses Satzes verloren oder wird für die Übersetzung des restlichen Satzes eingeschränkt. Das heißt, wenn der Ausdruck oder das Wort im Satzzusammenhang gemäß dem bereitgestellten Wörterbuch übersetzt wird, leidet oft die allgemeine Übersetzungsqualität des Satzes darunter.
Das Ausdruckswörterbuch eignet sich gut für zusammengesetzte Substantive wie Produktnamen („Microsoft SQL Server“), Eigennamen („City of Hamburg“) oder Produktfunktionen („pivot table“). Bei Verben oder Adjektiven funktioniert das nicht so gut, da diese Wörter in der Regel sehr kontextabhängig in der Ausgangs- oder Zielsprache sind. Die bewährte Methode ist das ausschließliche Verwenden von Ausdruckswörterbucheinträgen für zusammengesetzte Substantive.
Beim Verwenden eines Ausdruckswörterbuchs sind Groß-/Kleinschreibung und Interpunktion wichtig. Bei den Einträgen im Wörterbuch wird zwischen Groß- und Kleinschreibung sowie Zeichensetzung unterschieden. Der Benutzerdefinierte Translator gleicht nur Wörter und Ausdrücke im Eingabesatz ab, die genau dieselbe Groß- und Kleinschreibung und dieselbe Zeichensetzung verwenden wie in der Quell-Wörterbuchdatei angegeben. Außerdem geben die Übersetzungen die Groß-/Kleinschreibung und Zeichensetzung wieder, die in der Ziel-Wörterbuchdatei angegeben ist.
Beispiel
- Wenn Sie ein Englisch-zu-Spanisch-System trainieren, das ein Ausdruckswörterbuch verwendet, und Sie geben SQL Server in der Quelldatei und Microsoft SQL Server in der Zieldatei an. Wenn Sie die Übersetzung eines Satzes anfordern, der den Ausdruck SQL Server enthält, wird der Benutzerdefinierte Translator den Wörterbucheintrag und die Übersetzung, die Microsoft SQL Server enthält, abgleichen.
- Wenn Sie die Übersetzung eines Satzes anfordern, der den gleichen Ausdruck enthält, aber nicht mit dem übereinstimmt, was in Ihrer Quelldatei steht, wie z. B. sql server, sql Server oder SQL Server, wird kein Treffer aus Ihrem Wörterbuch zurückgegeben.
- Die Übersetzung folgt den Regeln der Zielsprache, wie sie in Ihrem Ausdruckswörterbuch angegeben sind.
Weitere Informationen zu neuronalen Ausdruckswörterbüchern finden Sie in den Leitfäden und Empfehlungen für neuronale Wörterbücher.
Bei Verwendung eines Satzwörterbuchs wird das Satzzeichen am Ende des Satzes ignoriert.
Beispiel
- Wenn Ihr Ausgangswörterbuch den Satz „Dieser Satz endet mit Satzzeichen!“ enthält, dann werden alle Übersetzungsanfragen, die „Dieser Satz endet mit Satzzeichen“ enthalten, übereinstimmen.
Ihr Wörterbuch sollte eindeutige Quellzeilen enthalten. Wenn eine Quellzeile (ein Wort, ein Ausdruck oder ein Satz) mehr als einmal in einer Wörterbuchdatei vorkommt, verwendet das System immer den letzten Eintrag und gibt das Ziel zurück, wenn eine Übereinstimmung gefunden wird.
Vermeiden Sie es, Ausdrücke, die nur aus Zahlen oder aus zwei oder drei Buchstaben bestehen, wie z. B. Akronyme, in die Quellwörterbuchdatei aufzunehmen.