Delen via


Wat is een woordenlijst?

Een woordenlijst is een uitgelijnd paar documenten waarmee een lijst met woordgroepen of zinnen en de bijbehorende vertalingen wordt opgegeven. Gebruik een woordenlijst in uw training wanneer u wilt dat Translator alle exemplaren van de bronterm of zin vertaalt met behulp van de vertaling die u in de woordenlijst opgeeft. Woordenlijsten worden soms woordenlijsten of termenbasissen genoemd. U kunt de woordenlijst beschouwen als brute force 'kopiƫren en vervangen' voor alle termen die u op de lijst vermeldt. Bovendien bouwt en maakt de Microsoft Custom Translator-service gebruik van eigen woordenlijsten voor algemeen gebruik om de kwaliteit van de vertaling te verbeteren. Een door de klant verstrekte woordenlijst heeft echter een bronwoord en wordt eerst doorzocht om woorden of zinnen op te zoeken.

Woordenlijsten werken alleen voor projecten in taalparen met een volledig ondersteund Algemeen neuraal netwerkmodel van Microsoft. Bekijk de volledige lijst met talen.

Woordgroepenwoordenlijst

Een woordgroepswoordenlijst is hoofdlettergevoelig. Het is een exacte zoek- en vervangbewerking. Wanneer u een woordgroepswoordenlijst opneemt in het trainen van uw model, worden woorden of woordgroepen die worden vermeld, vertaald op de manier die is opgegeven. De rest van de zin wordt zoals gebruikelijk vertaald. U kunt een woordgroepswoordenlijst gebruiken om zinnen op te geven die niet moeten worden vertaald door dezelfde niet-vertaalde woordgroep op te geven in de bron- en doelbestanden.

Dynamische woordenlijst

Met de functie dynamische woordenlijst kunt u vertalingen aanpassen voor specifieke termen of woordgroepen. U definieert aangepaste vertalingen voor uw unieke context, taal of specifieke behoeften.

Woordenlijst voor neurale woordgroepen

De woordenlijst voor neurale woordgroepen breidt onze dynamische woordenlijst - en standaardwoordenlijstfuncties uit. Met dynamische woordenlijsten en woordgroepen kunt u de vertaaluitvoer aanpassen door uw eigen vertalingen voor specifieke termen of woordgroepen op te geven. De functie dynamische woordenlijst wordt gebruikt met de Translator-API terwijl de neurale woordgroepwoordenlijst is ingeschakeld met behulp van Custom Translator. De woordenlijst voor neurale woordgroepen verbetert de vertaalkwaliteit voor zinnen die een of meer termenomzettingen bevatten door het model voor automatische vertaling zowel de term als de context aan te passen. Deze aanpassing produceert vloeiendere vertalingen. Tegelijkertijd blijft de nauwkeurigheid van de vertaling op hoge termijn behouden.

Zinswoordenlijst

Een zinswoordenlijst is hoofdlettergevoelig. Met de zinswoordenlijst kunt u een exacte doelomzetting voor een bronzin opgeven. De volledige verzonden zin moet overeenkomen met de bronwoordenlijstvermelding om een woordenlijst te vinden. Een bronwoordenlijstvermelding die eindigt op interpunctie, wordt tijdens de overeenkomst genegeerd. Als slechts een deel van de zin overeenkomt, komt de vermelding niet overeen. Wanneer een overeenkomst wordt gedetecteerd, wordt de doelvermelding van de zinswoordenlijst geretourneerd.

Trainings voor alleen woordenlijst

U kunt een model trainen met behulp van alleen woordenlijstgegevens. Hiervoor selecteert u alleen het woordenlijstdocument (of meerdere woordenlijstdocumenten) die u wilt opnemen en selecteert u Model maken. Omdat deze training alleen woordenlijst is, is er geen minimum aantal trainingszinnen vereist. Uw model voltooit doorgaans sneller training dan een standaardtraining. De resulterende modellen gebruiken de Microsoft-basislijnmodellen voor vertaling met de toevoeging van de woordenlijsten die u toevoegt. U krijgt geen testrapport.

Notitie

Custom Translator lijnt woordenlijstbestanden niet uit, dus het is belangrijk dat er een gelijk aantal bron- en doelzinnen/zinnen in uw woordenlijstdocumenten zijn en dat ze nauwkeurig zijn uitgelijnd.

Aanbevelingen

  • Woordenlijsten zijn geen vervanging voor het trainen van een model met behulp van trainingsgegevens. Voor betere resultaten is het aangeraden om het systeem te laten leren van uw trainingsgegevens. Wanneer zinnen of samengestelde zelfstandige naamwoorden echter letterlijk moeten worden vertaald, gebruikt u een woordenlijst.

  • De woordenlijst moet spaarzaam worden gebruikt. Wanneer een zin in een zin wordt vervangen, gaat de context van die zin verloren of beperkt voor het vertalen van de rest van de zin. Het resultaat is dat, terwijl de woordgroep of het woord in de zin wordt vertaald volgens de opgegeven woordenlijst, de algehele vertaalkwaliteit van de zin vaak lijdt.

  • De woordgroepenwoordenlijst werkt goed voor samengestelde zelfstandige naamwoorden, zoals productnamen ('Microsoft SQL Server'), de juiste namen ('Stad Hamburg') of productfuncties ('draaitabel'). Het werkt niet zo goed voor werkwoorden of bijvoeglijke naamwoorden, omdat deze woorden doorgaans zeer contextueel zijn binnen de bron- of doeltaal. U kunt het beste woordenlijstvermeldingen voorkomen voor alles behalve samengestelde zelfstandige naamwoorden.

  • Als u een woordenlijst gebruikt, zijn hoofdlettergebruik en leestekens belangrijk. Woordenlijstitems zijn hoofdlettergevoelig en interpunctiegevoelig. Custom Translator komt alleen overeen met woorden en woordgroepen in de invoerzin die exact dezelfde hoofdletters en leestekens gebruiken als opgegeven in het bronwoordenlijstbestand. Vertalingen weerspiegelen ook het hoofdlettergebruik en de interpunctie in het doelwoordenlijstbestand.

    Voorbeeld

    • Als u een Engels-naar-Spaans systeem traint dat gebruikmaakt van een woordenlijst en u sql-server opgeeft in het bronbestand en Microsoft SQL Server in het doelbestand. Wanneer u de vertaling aanvraagt van een zin die de woordgroep SQL-server bevat, komt Custom Translator overeen met de woordenlijstvermelding en de vertaling die Microsoft SQL Server bevat.
    • Wanneer u een vertaling aanvraagt van een zin die dezelfde woordgroep bevat, maar niet overeenkomt met wat zich in uw bronbestand bevindt, zoals sql server, sql Server of SQL Server, retourneert deze geen overeenkomst uit uw woordenlijst.
    • De vertaling volgt de regels van de doeltaal, zoals opgegeven in de woordenlijst.
  • Zie richtlijnen en aanbevelingen voor neurale woordenlijst voor meer informatie over de woordenlijst voor neurale woordgroepen.

  • Als u een zinswoordenlijst gebruikt, wordt interpunctie aan het einde van de zin genegeerd.

    Voorbeeld

    • Als uw bronwoordenlijst 'Deze zin eindigt op interpunctie!' bevat, worden alle vertaalaanvragen die 'Deze zin eindigt met interpunctie' overeenkomen.
  • De woordenlijst moet unieke bronregels bevatten. Als een bronregel (een woord, woordgroep of zin) meerdere keren in een woordenlijstbestand wordt weergegeven, gebruikt het systeem altijd het laatste gegeven en retourneert het doel wanneer een overeenkomst wordt gevonden.

  • Vermijd het toevoegen van woordgroepen die bestaan uit alleen cijfers of woorden met twee of drie letters, zoals acroniemen, in het bronwoordenlijstbestand.

Volgende stappen