Principy rozpoznávání jazyka, překladu a transkliterace
Pojďme se podívat na možnosti služby Azure AI Translator. Mezi tyto schopnosti patří:
Rozpoznávání jazyka
Funkci Detect rozhraní REST API můžete použít ke zjištění jazyka, ve kterém je text napsaný.
Do koncového https://api.cognitive.microsofttranslator.com/detect?api-version=3.0
bodu můžete například odeslat následující text pomocí nástroje curl.
Tady je text, který chceme přeložit:
{ 'Text' : 'こんにちは' }
Tady je volání využívající curl ke koncovému bodu, které rozpozná jazyk textu:
curl -X POST "https://api.cognitive.microsofttranslator.com/detect?api-version=3.0" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Content-Type: application/json" -d "[{ 'Text' : 'こんにちは' }]
Odpověď na tento požadavek vypadá takto, což znamená, že text je napsaný v japonštině:
[
{
"language": "ja",
"score": 1.0,
"isTranslationSupported": true,
"isTransliterationSupported": true
}
]
Překlad
Pokud chcete přeložit text z jednoho jazyka do druhého, použijte funkci Translate; zadáním jednoho parametru označujícího zdrojový jazyk a jednoho nebo více parametrů k určení jazyků, do kterých chcete text přeložit.
Můžete například odeslat stejný kód JSON, který jsme dříve použili k rozpoznání jazyka, zadání parametru ja (japonština) a dva parametry s hodnotami en (angličtina) a fr (francouzština). Uděláte to tak, že zavoláte:
curl -X POST "https://api.cognitive.microsofttranslator.com/translate?api-version=3.0&from=ja&to=fr&to=en" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Content-Type: application/json; charset=UTF-8" -d "[{ 'Text' : 'こんにちは' }]"
Výsledkem by byl následující výsledek:
[
{"translations":
[
{"text": "Hello", "to": "en"},
{"text": "Bonjour", "to": "fr"}
]
}
]
Transkripce
Náš japonský text je napsaný pomocí skriptu Hiragana, takže místo překladu do jiného jazyka ho můžete chtít převést na jiný skript – například k vykreslení textu v latince (jak se používá v anglickém jazyce).
Abychom toho dosáhli, můžeme do funkce Transliterate odeslat japonský text s parametrem ZScriptu Jpan a parametrem toScript latn:
curl -X POST "https://api.cognitive.microsofttranslator.com/transliterate?api-version=3.0&fromScript=Jpan&toScript=Latn" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Content-Type: application/json" -d "[{ 'Text' : 'こんにちは' }]"
Odpověď by vám poskytla následující výsledek:
[
{
"script": "Latn",
"text": "Kon'nichiwa"
}
]