Omówienie wykrywania, tłumaczenia i transliteracji języka
Przyjrzyjmy się możliwościom usługi Azure AI Translator. Dostępne są następujące możliwości:
Wykrywanie języka
Funkcja Detect interfejsu API REST umożliwia wykrywanie języka, w którym jest napisany tekst.
Możesz na przykład przesłać następujący tekst do punktu końcowego https://api.cognitive.microsofttranslator.com/detect?api-version=3.0
przy użyciu narzędzia curl.
Oto tekst, który chcemy przetłumaczyć:
{ 'Text' : 'こんにちは' }
Oto wywołanie przy użyciu narzędzia curl do punktu końcowego w celu wykrycia języka naszego tekstu:
curl -X POST "https://api.cognitive.microsofttranslator.com/detect?api-version=3.0" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Content-Type: application/json" -d "[{ 'Text' : 'こんにちは' }]
Odpowiedź na to żądanie wygląda następująco, co oznacza, że tekst jest napisany w języku japońskim:
[
{
"language": "ja",
"score": 1.0,
"isTranslationSupported": true,
"isTransliterationSupported": true
}
]
Tłumaczenie
Aby przetłumaczyć tekst z jednego języka na inny, użyj funkcji Translate, określając pojedynczą wartość z parametru, aby wskazać język źródłowy, oraz jeden lub więcej parametrów, aby określić języki, w których ma zostać przetłumaczony tekst.
Na przykład można przesłać ten sam kod JSON, którego wcześniej używaliśmy do wykrywania języka, określając parametr z parametru ja (japoński) i dwa do parametrów z wartościami en (angielski) i fr (francuski). W tym celu należy wywołać następujące wywołanie:
curl -X POST "https://api.cognitive.microsofttranslator.com/translate?api-version=3.0&from=ja&to=fr&to=en" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Content-Type: application/json; charset=UTF-8" -d "[{ 'Text' : 'こんにちは' }]"
Spowoduje to wygenerowanie następującego wyniku:
[
{"translations":
[
{"text": "Hello", "to": "en"},
{"text": "Bonjour", "to": "fr"}
]
}
]
Transliteracja
Nasz japoński tekst jest pisany przy użyciu skryptu Hiragana, więc zamiast tłumaczyć go na inny język, warto transliterować go do innego skryptu — na przykład w celu renderowania tekstu w skrypcie łacińskim (używanego przez tekst w języku angielskim).
Aby to osiągnąć, możemy przesłać japoński tekst do funkcji Transliterate z parametrem fromScript Jpan i parametrem toScript latn:
curl -X POST "https://api.cognitive.microsofttranslator.com/transliterate?api-version=3.0&fromScript=Jpan&toScript=Latn" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Content-Type: application/json" -d "[{ 'Text' : 'こんにちは' }]"
Odpowiedź daje następujący wynik:
[
{
"script": "Latn",
"text": "Kon'nichiwa"
}
]