Delen via


Translator 3.0: Opzoeken in woordenlijst

Biedt alternatieve vertalingen voor een woord en een paar idiomatische zinnen. Elke vertaling heeft een deel van de spraak en een lijst met back-vertalingen. Met de back-vertalingen kan een gebruiker de vertaling in context begrijpen. De bewerking Voorbeeld van woordenlijst bevat voorbeeldgebruik van elk vertaalpaar.

Aanvraag-URL

Een aanvraag POST versturen naar:

https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0

Zie Virtual Network Support for Translator service selected network and private endpoint configuration and support.

Aanvraagparameters

Aanvraagparameters die worden doorgegeven aan de queryreeks zijn:

Queryparameter Beschrijving
api-versie Vereiste parameter.
Versie van de API die door de client is aangevraagd. Waarde moet zijn 3.0
from Vereiste parameter.
Hiermee geeft u de taal van de invoertekst. De brontaal moet een van de ondersteunde talen in het dictionary bereik zijn.
to Vereiste parameter.
Hiermee geeft u de taal van de uitvoertekst. De doeltaal moet een van de ondersteunde talen in het dictionary bereik zijn.

Aanvraagheaders zijn onder andere:

Kopteksten Beschrijving
Verificatieheaders Vereiste aanvraagheader.
Zie Verificatie.
Inhoudstype Vereiste aanvraagheader.
Hiermee geeft u het inhoudstype van de payload op. Mogelijke waarden zijn: application/json.
Content-Length Optioneel.
De lengte van de aanvraagtekst.
X-ClientTraceId Optioneel.
Een door de client gegenereerde GUID om de aanvraag op unieke wijze te identificeren. U kunt deze header weglaten als u de tracerings-id in de queryreeks opneemt middels een queryparameter met de naam ClientTraceId.

Aanvraagtekst

De hoofdtekst van de aanvraag is een JSON-matrix. Elk matrixelement is een JSON-object met een tekenreekseigenschap met de naam Text, die de term vertegenwoordigt die moet worden opgezocht.

[
    {"Text":"fly"}
]

De volgende beperkingen zijn van toepassing:

  • De matrix kan maximaal 10 elementen bevatten.
  • De tekstwaarde van een matrixelement mag niet langer zijn dan 100 tekens, inclusief spaties.

Hoofdtekst van de reactie

Een geslaagd antwoord is een JSON-matrix met één resultaat voor elke tekenreeks in de invoermatrix. Een resultaatobject bevat de volgende eigenschappen:

  • normalizedSource: Een tekenreeks die de genormaliseerde vorm van de bronterm geeft. Als de aanvraag bijvoorbeeld is, is JOHNjohnhet genormaliseerde formulier . De inhoud van dit veld wordt de invoer voor opzoekvoorbeelden.

  • displaySource: Een tekenreeks die de bronterm in een vorm geeft die het meest geschikt is voor weergave door eindgebruikers. Als de invoer bijvoorbeeld is JOHN, weerspiegelt het weergaveformulier de gebruikelijke spelling van de naam: John.

  • translations: Een lijst met vertalingen voor de bronterm. Elk element van de lijst is een object met de volgende eigenschappen:

  • normalizedTarget: Een tekenreeks die de genormaliseerde vorm van deze term in de doeltaal geeft. Deze waarde moet worden gebruikt als invoer voor opzoekvoorbeelden.

  • displayTarget: Een tekenreeks die de term in de doeltaal geeft en in een vorm die het meest geschikt is voor weergave door eindgebruikers. Over het algemeen verschilt deze eigenschap alleen van het normalizedTarget hoofdlettergebruik. Bijvoorbeeld een eigen zelfstandig naamwoord zoals Juan heeft normalizedTarget = "juan" en displayTarget = "Juan".

  • posTag: Een tekenreeks die deze term aan een deel van de spraaktag koppelen.

    Naam van tag Beschrijving
    ADJ Bijvoeglijke naamwoorden
    ADV Bewerkingsparameters
    CONJ Voegwoorden
    DET Bepalende waarden
    MODAL Termen
    NOUN Nouns
    PREP Voorzetsels
    PRON Voornaamwoorden
    VERB Termen
    OTHER Overige

    Als implementatienotitie zijn deze tags onderdeel van spraak die aan de Engelse zijde worden gelabeld en vervolgens de meest voorkomende tag voor elk bron-/doelpaar wordt gebruikt. Dus als mensen vaak een Spaans woord vertalen naar een ander deel-van-spraak tag in het Engels, is tags cab uiteindelijk verkeerd (met betrekking tot het Spaanse woord).

  • confidence: Een waarde tussen 0,0 en 1,0 die de "betrouwbaarheid" (of nauwkeuriger, "waarschijnlijkheid in de trainingsgegevens") van dat vertaalpaar vertegenwoordigt. De som van betrouwbaarheidsscores voor één bronwoord kan of kan niet worden opgeteld bij 1,0.

  • prefixWord: Een tekenreeks die het woord weergeeft als voorvoegsel van de vertaling. Momenteel is deze eigenschap de geslachte bepalende waarde van zelfstandige naamwoorden, in talen met geslachtsbesturingselementen. Het voorvoegsel van het Spaanse woord mosca is labijvoorbeeld , omdat mosca het een vrouwelijk zelfstandig naamwoord in het Spaans is. Deze waarde is alleen afhankelijk van de vertaling en niet van de bron. Als er geen voorvoegsel is, is dit de lege tekenreeks.

  • backTranslations: Een lijst met 'back-vertalingen' van het doel. Bijvoorbeeld bronwoorden waarnaar het doel kan vertalen. De lijst bevat gegarandeerd het bronwoord dat is aangevraagd (bijvoorbeeld als het bronwoord dat wordt opgezocht, flyis opgenomen fly in de backTranslations lijst). Het is echter niet gegarandeerd dat het de eerste positie heeft en vaak niet. Elk element van de backTranslations lijst is een object dat wordt beschreven door de volgende eigenschappen:

    • normalizedText: Een tekenreeks die de genormaliseerde vorm geeft van de bronterm die een back-vertaling van het doel is. Deze waarde moet worden gebruikt als invoer voor opzoekvoorbeelden.

    • displayText: Een tekenreeks die de bronterm geeft die een back-vertaling van het doel is in een vorm die het meest geschikt is voor weergave door eindgebruikers.

    • numExamples: Een geheel getal dat het aantal voorbeelden aangeeft dat beschikbaar is voor dit vertaalpaar. Werkelijke voorbeelden moeten worden opgehaald met een afzonderlijke aanroep naar opzoekvoorbeelden. Het getal is voornamelijk bedoeld om weergave in een UX mogelijk te maken. Een gebruikersinterface kan bijvoorbeeld een hyperlink toevoegen aan de back-translation als het aantal voorbeelden groter is dan nul. Vervolgens wordt de back-translation weergegeven als tekst zonder opmaak als er geen voorbeelden zijn. Het werkelijke aantal voorbeelden dat door een aanroep naar opzoekvoorbeelden wordt geretourneerd, kan kleiner zijn dan numExamples, omdat er snel meer filters kunnen worden toegepast om 'slechte' voorbeelden te verwijderen.

    • frequencyCount: Een geheel getal dat de frequentie van dit vertaalpaar in de gegevens aangeeft. Het belangrijkste doel van dit veld is om een gebruikersinterface te bieden met een middel om back-vertalingen te sorteren, zodat de meest voorkomende termen eerst zijn.

      Notitie

      Als de term die wordt opgezoekd niet bestaat in de woordenlijst, is het antwoord 200 (OK), maar is de translations lijst een lege lijst.

Voorbeelden

In dit voorbeeld ziet u hoe u alternatieve vertalingen in het Spaans van de Engelse term fly kunt opzoeken.

curl -X POST "https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0&from=en&to=es" -H "Ocp-Apim-Subscription-Key: <client-secret>" -H "Content-Type: application/json" -d "[{'Text':'fly'}]"

De antwoordtekst (afgekort voor duidelijkheid) is:

[
    {
        "normalizedSource":"fly",
        "displaySource":"fly",
        "translations":[
            {
                "normalizedTarget":"volar",
                "displayTarget":"volar",
                "posTag":"VERB",
                "confidence":0.4081,
                "prefixWord":"",
                "backTranslations":[
                    {"normalizedText":"fly","displayText":"fly","numExamples":15,"frequencyCount":4637},
                    {"normalizedText":"flying","displayText":"flying","numExamples":15,"frequencyCount":1365},
                    {"normalizedText":"blow","displayText":"blow","numExamples":15,"frequencyCount":503},
                    {"normalizedText":"flight","displayText":"flight","numExamples":15,"frequencyCount":135}
                ]
            },
            {
                "normalizedTarget":"mosca",
                "displayTarget":"mosca",
                "posTag":"NOUN",
                "confidence":0.2668,
                "prefixWord":"",
                "backTranslations":[
                    {"normalizedText":"fly","displayText":"fly","numExamples":15,"frequencyCount":1697},
                    {"normalizedText":"flyweight","displayText":"flyweight","numExamples":0,"frequencyCount":48},
                    {"normalizedText":"flies","displayText":"flies","numExamples":9,"frequencyCount":34}
                ]
            },
            //
            // ...list abbreviated for documentation clarity
            //
        ]
    }
]

In dit voorbeeld ziet u wat er gebeurt wanneer de term die wordt opgezoekt niet bestaat voor het geldige woordenlijstpaar.

curl -X POST "https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0&from=en&to=es" -H "X-ClientTraceId: 875030C7-5380-40B8-8A03-63DACCF69C11" -H "Ocp-Apim-Subscription-Key: <client-secret>" -H "Content-Type: application/json" -d "[{'Text':'fly123456'}]"

Omdat de term niet wordt gevonden in de woordenlijst, bevat de hoofdtekst van het antwoord een lege translations lijst.

[
    {
        "normalizedSource":"fly123456",
        "displaySource":"fly123456",
        "translations":[]
    }
]