Translator 3.0: Opzoeken in woordenlijst
Biedt alternatieve vertalingen voor een woord en een paar idiomatische zinnen. Elke vertaling heeft een deel van de spraak en een lijst met back-vertalingen. Met de back-vertalingen kan een gebruiker de vertaling in context begrijpen. De bewerking Voorbeeld van woordenlijst bevat voorbeeldgebruik van elk vertaalpaar.
Aanvraag-URL
Een aanvraag POST
versturen naar:
https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0
Zie Virtual Network Support for Translator service selected network and private endpoint configuration and support.
Aanvraagparameters
Aanvraagparameters die worden doorgegeven aan de queryreeks zijn:
Queryparameter | Beschrijving |
---|---|
api-versie | Vereiste parameter. Versie van de API die door de client is aangevraagd. Waarde moet zijn 3.0 |
from | Vereiste parameter. Hiermee geeft u de taal van de invoertekst. De brontaal moet een van de ondersteunde talen in het dictionary bereik zijn. |
to | Vereiste parameter. Hiermee geeft u de taal van de uitvoertekst. De doeltaal moet een van de ondersteunde talen in het dictionary bereik zijn. |
Aanvraagheaders zijn onder andere:
Kopteksten | Beschrijving |
---|---|
Verificatieheaders | Vereiste aanvraagheader. Zie Verificatie. |
Inhoudstype | Vereiste aanvraagheader. Hiermee geeft u het inhoudstype van de payload op. Mogelijke waarden zijn: application/json . |
Content-Length | Optioneel. De lengte van de aanvraagtekst. |
X-ClientTraceId | Optioneel. Een door de client gegenereerde GUID om de aanvraag op unieke wijze te identificeren. U kunt deze header weglaten als u de tracerings-id in de queryreeks opneemt middels een queryparameter met de naam ClientTraceId . |
Aanvraagtekst
De hoofdtekst van de aanvraag is een JSON-matrix. Elk matrixelement is een JSON-object met een tekenreekseigenschap met de naam Text
, die de term vertegenwoordigt die moet worden opgezocht.
[
{"Text":"fly"}
]
De volgende beperkingen zijn van toepassing:
- De matrix kan maximaal 10 elementen bevatten.
- De tekstwaarde van een matrixelement mag niet langer zijn dan 100 tekens, inclusief spaties.
Hoofdtekst van de reactie
Een geslaagd antwoord is een JSON-matrix met één resultaat voor elke tekenreeks in de invoermatrix. Een resultaatobject bevat de volgende eigenschappen:
normalizedSource
: Een tekenreeks die de genormaliseerde vorm van de bronterm geeft. Als de aanvraag bijvoorbeeld is, isJOHN
john
het genormaliseerde formulier . De inhoud van dit veld wordt de invoer voor opzoekvoorbeelden.displaySource
: Een tekenreeks die de bronterm in een vorm geeft die het meest geschikt is voor weergave door eindgebruikers. Als de invoer bijvoorbeeld isJOHN
, weerspiegelt het weergaveformulier de gebruikelijke spelling van de naam:John
.translations
: Een lijst met vertalingen voor de bronterm. Elk element van de lijst is een object met de volgende eigenschappen:normalizedTarget
: Een tekenreeks die de genormaliseerde vorm van deze term in de doeltaal geeft. Deze waarde moet worden gebruikt als invoer voor opzoekvoorbeelden.displayTarget
: Een tekenreeks die de term in de doeltaal geeft en in een vorm die het meest geschikt is voor weergave door eindgebruikers. Over het algemeen verschilt deze eigenschap alleen van hetnormalizedTarget
hoofdlettergebruik. Bijvoorbeeld een eigen zelfstandig naamwoord zoalsJuan
heeftnormalizedTarget = "juan"
endisplayTarget = "Juan"
.posTag
: Een tekenreeks die deze term aan een deel van de spraaktag koppelen.Naam van tag Beschrijving ADJ
Bijvoeglijke naamwoorden ADV
Bewerkingsparameters CONJ
Voegwoorden DET
Bepalende waarden MODAL
Termen NOUN
Nouns PREP
Voorzetsels PRON
Voornaamwoorden VERB
Termen OTHER
Overige Als implementatienotitie zijn deze tags onderdeel van spraak die aan de Engelse zijde worden gelabeld en vervolgens de meest voorkomende tag voor elk bron-/doelpaar wordt gebruikt. Dus als mensen vaak een Spaans woord vertalen naar een ander deel-van-spraak tag in het Engels, is tags cab uiteindelijk verkeerd (met betrekking tot het Spaanse woord).
confidence
: Een waarde tussen 0,0 en 1,0 die de "betrouwbaarheid" (of nauwkeuriger, "waarschijnlijkheid in de trainingsgegevens") van dat vertaalpaar vertegenwoordigt. De som van betrouwbaarheidsscores voor één bronwoord kan of kan niet worden opgeteld bij 1,0.prefixWord
: Een tekenreeks die het woord weergeeft als voorvoegsel van de vertaling. Momenteel is deze eigenschap de geslachte bepalende waarde van zelfstandige naamwoorden, in talen met geslachtsbesturingselementen. Het voorvoegsel van het Spaanse woordmosca
isla
bijvoorbeeld , omdatmosca
het een vrouwelijk zelfstandig naamwoord in het Spaans is. Deze waarde is alleen afhankelijk van de vertaling en niet van de bron. Als er geen voorvoegsel is, is dit de lege tekenreeks.backTranslations
: Een lijst met 'back-vertalingen' van het doel. Bijvoorbeeld bronwoorden waarnaar het doel kan vertalen. De lijst bevat gegarandeerd het bronwoord dat is aangevraagd (bijvoorbeeld als het bronwoord dat wordt opgezocht,fly
is opgenomenfly
in debackTranslations
lijst). Het is echter niet gegarandeerd dat het de eerste positie heeft en vaak niet. Elk element van debackTranslations
lijst is een object dat wordt beschreven door de volgende eigenschappen:normalizedText
: Een tekenreeks die de genormaliseerde vorm geeft van de bronterm die een back-vertaling van het doel is. Deze waarde moet worden gebruikt als invoer voor opzoekvoorbeelden.displayText
: Een tekenreeks die de bronterm geeft die een back-vertaling van het doel is in een vorm die het meest geschikt is voor weergave door eindgebruikers.numExamples
: Een geheel getal dat het aantal voorbeelden aangeeft dat beschikbaar is voor dit vertaalpaar. Werkelijke voorbeelden moeten worden opgehaald met een afzonderlijke aanroep naar opzoekvoorbeelden. Het getal is voornamelijk bedoeld om weergave in een UX mogelijk te maken. Een gebruikersinterface kan bijvoorbeeld een hyperlink toevoegen aan de back-translation als het aantal voorbeelden groter is dan nul. Vervolgens wordt de back-translation weergegeven als tekst zonder opmaak als er geen voorbeelden zijn. Het werkelijke aantal voorbeelden dat door een aanroep naar opzoekvoorbeelden wordt geretourneerd, kan kleiner zijn dannumExamples
, omdat er snel meer filters kunnen worden toegepast om 'slechte' voorbeelden te verwijderen.frequencyCount
: Een geheel getal dat de frequentie van dit vertaalpaar in de gegevens aangeeft. Het belangrijkste doel van dit veld is om een gebruikersinterface te bieden met een middel om back-vertalingen te sorteren, zodat de meest voorkomende termen eerst zijn.Notitie
Als de term die wordt opgezoekd niet bestaat in de woordenlijst, is het antwoord 200 (OK), maar is de
translations
lijst een lege lijst.
Voorbeelden
In dit voorbeeld ziet u hoe u alternatieve vertalingen in het Spaans van de Engelse term fly
kunt opzoeken.
curl -X POST "https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0&from=en&to=es" -H "Ocp-Apim-Subscription-Key: <client-secret>" -H "Content-Type: application/json" -d "[{'Text':'fly'}]"
De antwoordtekst (afgekort voor duidelijkheid) is:
[
{
"normalizedSource":"fly",
"displaySource":"fly",
"translations":[
{
"normalizedTarget":"volar",
"displayTarget":"volar",
"posTag":"VERB",
"confidence":0.4081,
"prefixWord":"",
"backTranslations":[
{"normalizedText":"fly","displayText":"fly","numExamples":15,"frequencyCount":4637},
{"normalizedText":"flying","displayText":"flying","numExamples":15,"frequencyCount":1365},
{"normalizedText":"blow","displayText":"blow","numExamples":15,"frequencyCount":503},
{"normalizedText":"flight","displayText":"flight","numExamples":15,"frequencyCount":135}
]
},
{
"normalizedTarget":"mosca",
"displayTarget":"mosca",
"posTag":"NOUN",
"confidence":0.2668,
"prefixWord":"",
"backTranslations":[
{"normalizedText":"fly","displayText":"fly","numExamples":15,"frequencyCount":1697},
{"normalizedText":"flyweight","displayText":"flyweight","numExamples":0,"frequencyCount":48},
{"normalizedText":"flies","displayText":"flies","numExamples":9,"frequencyCount":34}
]
},
//
// ...list abbreviated for documentation clarity
//
]
}
]
In dit voorbeeld ziet u wat er gebeurt wanneer de term die wordt opgezoekt niet bestaat voor het geldige woordenlijstpaar.
curl -X POST "https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0&from=en&to=es" -H "X-ClientTraceId: 875030C7-5380-40B8-8A03-63DACCF69C11" -H "Ocp-Apim-Subscription-Key: <client-secret>" -H "Content-Type: application/json" -d "[{'Text':'fly123456'}]"
Omdat de term niet wordt gevonden in de woordenlijst, bevat de hoofdtekst van het antwoord een lege translations
lijst.
[
{
"normalizedSource":"fly123456",
"displaySource":"fly123456",
"translations":[]
}
]