Kognitivní dovednost rozpoznávání jazyka
Dovednost Rozpoznávání jazyka rozpozná jazyk vstupního textu a hlásí jeden kód jazyka pro každý dokument odeslaný na žádost. Kód jazyka je spárovaný se skóre označujícím sílu analýzy. Tato dovednost využívá modely strojového učení poskytované v jazyce Azure AI.
Tato funkce je užitečná zejména v případě, že potřebujete poskytnout jazyk textu jako vstup do jiných dovedností (například dovednost analýza mínění nebo dovednost Rozdělení textu).
Viz podporované jazyky pro rozpoznávání jazyka. Pokud máte obsah vyjádřený v nepodporovaném jazyce, odpověď je (Unknown)
.
Poznámka:
Tato dovednost je vázána na služby Azure AI a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.
@odata.type
Microsoft.Skills.Text.LanguageDetectionSkill
Omezení dat
Maximální velikost záznamu by měla být 50 000 znaků měřená String.Length
hodnotou . Pokud potřebujete data rozdělit před odesláním do dovednosti rozpoznávání jazyka, můžete použít dovednost Rozdělení textu.
Parametry dovedností
Parametry rozlišují malá a velká písmena.
Vstupy | Popis |
---|---|
defaultCountryHint |
(Volitelné) Kód země se dvěma písmeny ISO 3166-1 alfa-2 lze poskytnout jako nápovědu k modelu rozpoznávání jazyka, pokud jazyk nedokáže nejednoznačit. Konkrétně se defaultCountryHint parametr používá s dokumenty, které nezadávají countryHint vstup explicitně. |
modelVersion |
(Volitelné) Určuje verzi modelu, která se má použít při volání rozpoznávání jazyka. Výchozí hodnota je nejnovější dostupná, pokud není zadána. Tuto hodnotu doporučujeme nezadávat, pokud není nutná. |
Vstupy dovedností
Parametry rozlišují malá a velká písmena.
Vstupy | Popis |
---|---|
text |
Text, který se má analyzovat. |
countryHint |
Kód země iso 3166-1 alfa-2, který se použije jako nápověda k modelu rozpoznávání jazyka, pokud jazyk nedokáže nejednoznačit. |
Výstupy dovedností
Název výstupu | Popis |
---|---|
languageCode |
Kód jazyka ISO 6391 pro identifikovaný jazyk. Například "en". |
languageName |
Název jazyka. Například "Angličtina". |
score |
Hodnota mezi 0 a 1. Pravděpodobnost správné identifikace jazyka. Pokud má věta smíšené jazyky, může být skóre nižší než 1. |
Ukázková definice
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/text"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "myLanguageCode"
},
{
"name": "languageName",
"targetName": "myLanguageName"
},
{
"name": "score",
"targetName": "myLanguageScore"
}
]
}
Ukázkový vstup
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
},
{
"recordId": "3",
"data":
{
"text": "impossible",
"countryHint": "fr"
}
}
]
Ukázkový výstup
{
"values": [
{
"recordId": "1",
"data":
{
"languageCode": "en",
"languageName": "English",
"score": 1,
}
},
{
"recordId": "2",
"data":
{
"languageCode": "es",
"languageName": "Spanish",
"score": 1,
}
},
{
"recordId": "3",
"data":
{
"languageCode": "fr",
"languageName": "French",
"score": 1,
}
}
]
}