Kognitivní dovednost překladu textu
Dovednost Překlad textu vyhodnocuje text a pro každý záznam vrátí text přeložený do zadaného cílového jazyka. Tato dovednost využívá rozhraní Translator Text API verze 3.0 dostupné ve službách Azure AI.
Tato funkce je užitečná, pokud očekáváte, že vaše dokumenty nemusí být všechny v jednom jazyce, v takovém případě můžete text před indexováním přeložit do jednoho jazyka. Je také užitečné pro případy použití lokalizace, kdy můžete chtít mít kopie stejného textu dostupného ve více jazycích.
Translator Text API v3.0 je služba Azure AI mimo oblast, což znamená, že vaše data nejsou zaručená, že zůstanou ve stejné oblasti jako azure AI Search nebo připojený prostředek služeb Azure AI.
Poznámka:
Tato dovednost je vázána na služby Azure AI a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.
Při použití této dovednosti se všechny dokumenty ve zdroji zpracovávají a účtují za překlad, i když jsou zdrojové a cílové jazyky stejné. Toto chování je užitečné pro podporu více jazyků ve stejném dokumentu, ale může vést k zbytečnému zpracování. Abyste se vyhnuli neočekávaným poplatkům za fakturaci z dokumentů, které nevyžadují zpracování, přesuňte je před spuštěním dovednosti mimo kontejner zdroje dat.
@odata.type
Microsoft.Skills.Text.TranslationSkill
Omezení dat
Maximální velikost záznamu by měla být 50 000 znaků měřená String.Length
hodnotou . Pokud potřebujete data rozdělit před odesláním do dovednosti překladu textu, zvažte použití dovednosti Rozdělení textu. Pokud používáte dovednost rozdělení textu, nastavte délku stránky na 5 000 pro nejlepší výkon.
Parametry dovedností
Parametry rozlišují malá a velká písmena.
Vstupy | Popis |
---|---|
defaultToLanguageCode | (Povinné) Kód jazyka pro překlad dokumentů do dokumentů, které explicitně nezadávají jazyk "komu". Projděte si kompletní seznam podporovaných jazyků. |
defaultFromLanguageCode | (Volitelné) Kód jazyka pro překlad dokumentů z dokumentů, které explicitně nezadávají jazyk "from". Pokud není zadaný výchozí kódFromLanguageCode, použije se automatické rozpoznávání jazyka poskytované rozhraním Translator Text API k určení jazyka "from". Projděte si kompletní seznam podporovaných jazyků. |
suggestedFrom | (Volitelné) Kód jazyka pro překlad dokumentů z dokumentů, pokud fromLanguageCode nebo defaultFromLanguageCode nejsou zadané, a automatické rozpoznávání jazyka je neúspěšné. Pokud není zadaný navrhovaný jazykFrom, použije se angličtina (en) jako navrhovaný jazykFrom. Projděte si kompletní seznam podporovaných jazyků. |
Vstupy dovedností
Název vstupu | Popis |
---|---|
text | Text, který se má přeložit. |
toLanguageCode | Řetězec označující jazyk, na který má být text přeložen. Pokud tento vstup není zadaný, použije se k překladu textu výchozí kódToLanguageCode. Projděte si kompletní seznam podporovaných jazyků. |
fromLanguageCode | Řetězec označující aktuální jazyk textu. Pokud tento parametr není zadaný, použije se k překladu textu výchozíFromLanguageCode (nebo automatické rozpoznávání jazyka, pokud není zadaný výchozí kódFromLanguageCode). Projděte si kompletní seznam podporovaných jazyků. |
Výstupy dovedností
Název výstupu | Popis |
---|---|
přeložený text | Řetězcový výsledek překladu textu z přeloženéhoFromLanguageCode do přeloženéhoToLanguageCode. |
přeloženýToLanguageCode | Řetězec označující kód jazyka, na který byl text přeložen. Užitečné, pokud překládáte do více jazyků a chcete mít přehled o tom, který text je který jazyk. |
translatedFromLanguageCode | Řetězec označující kód jazyka, ze kterých byl text přeložen. Užitečné, pokud jste zvolili možnost automatického rozpoznávání jazyka, protože tento výstup vám poskytne výsledek detekce. |
Ukázková definice
{
"@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
"defaultToLanguageCode": "fr",
"suggestedFrom": "en",
"context": "/document",
"inputs": [
{
"name": "text",
"source": "/document/text"
}
],
"outputs": [
{
"name": "translatedText",
"targetName": "translatedText"
},
{
"name": "translatedFromLanguageCode",
"targetName": "translatedFromLanguageCode"
},
{
"name": "translatedToLanguageCode",
"targetName": "translatedToLanguageCode"
}
]
}
Ukázkový vstup
{
"values": [
{
"recordId": "1",
"data":
{
"text": "We hold these truths to be self-evident, that all men are created equal."
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
}
]
}
Ukázkový výstup
{
"values": [
{
"recordId": "1",
"data":
{
"translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
"translatedFromLanguageCode": "en",
"translatedToLanguageCode": "fr"
}
},
{
"recordId": "2",
"data":
{
"translatedText": "Nous sommes très heureux d'être avec vous.",
"translatedFromLanguageCode": "es",
"translatedToLanguageCode": "fr"
}
}
]
}
Chyby a upozornění
Pokud zadáte nepodporovaný kód jazyka "komu" nebo "from", vygeneruje se chyba a text se nepřeloží. Pokud je text prázdný, vytvoří se upozornění. Pokud je text větší než 50 000 znaků, přeloží se jenom prvních 50 000 znaků a zobrazí se upozornění.