Kognitivní dovednost extrakce klíčových frází
Dovednost extrakce klíčových frází vyhodnocuje nestrukturovaný text a pro každý záznam vrátí seznam klíčových frází. Tato dovednost využívá modely strojového učení klíčové fráze poskytované jazykem Azure AI.
Tato funkce je užitečná, pokud potřebujete rychle identifikovat hlavní body mluvení v záznamu. Například při zadání textu "Jídlo bylo vynikající a tam byl nádherný personál", služba vrátí "jídlo" a "nádherný personál".
Poznámka:
Tato dovednost je vázána na služby Azure AI a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.
@odata.type
Microsoft.Skills.Text.KeyPhraseExtractionSkill
Omezení dat
Maximální velikost záznamu by měla být 50 000 znaků měřená String.Length
hodnotou . Pokud potřebujete data před odesláním do extraktoru klíčových frází rozdělit, zvažte použití dovednosti Rozdělení textu. Pokud používáte dovednost rozdělení textu, nastavte délku stránky na 5 000 pro nejlepší výkon.
Parametry dovedností
Parametry rozlišují malá a velká písmena.
Vstupy | Popis |
---|---|
defaultLanguageCode |
(Volitelné) Kód jazyka, který se použije u dokumentů, které explicitně nezadávají jazyk. Pokud není zadaný výchozí kód jazyka, použije se angličtina (en) jako výchozí kód jazyka. Projděte si kompletní seznam podporovaných jazyků. |
maxKeyPhraseCount |
(Volitelné) Maximální počet klíčových frází, které se mají vytvořit. |
modelVersion |
(Volitelné) Určuje verzi modelu, kterou se má použít při volání rozhraní API pro klíčové fráze. Výchozí hodnota je nejnovější dostupná, pokud není zadána. Tuto hodnotu doporučujeme nezadávat, pokud není nutná. |
Vstupy dovedností
Vstup | Popis |
---|---|
text |
Text, který se má analyzovat. |
languageCode |
Řetězec označující jazyk záznamů. Pokud tento parametr není zadaný, použije se k analýze záznamů výchozí kód jazyka. Projděte si kompletní seznam podporovaných jazyků. |
Výstupy dovedností
Výstup | Popis |
---|---|
keyPhrases |
Seznam klíčových frází extrahovaných ze vstupního textu Klíčové fráze se vrátí v pořadí podle důležitosti. |
Ukázková definice
Představte si záznam SQL, který obsahuje následující pole:
{
"content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
"language": "en"
}
Definice dovedností pak může vypadat takto:
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "myKeyPhrases"
}
]
}
Ukázkový výstup
V předchozím příkladu se výstup vaší dovednosti zapíše do nového uzlu v rozšířeném stromu s názvem document/myKeyPhrases, protože je targetName
to ten, který jsme zadali. Pokud neurčíte targetName
, bude to "document/keyPhrases".
document/myKeyPhrases
[
"world’s glaciers",
"huge rivers of ice",
"Canadian Rockies",
"iconic landscapes",
"Mount Everest region",
"Continued warming"
]
Jako vstup do jiných dovedností nebo jako zdroj mapování výstupního pole můžete použít "document/myKeyPhrases".
Upozornění
Pokud zadáte nepodporovaný kód jazyka, vygeneruje se upozornění a nezextrahují se klíčové fráze. Pokud je text prázdný, vytvoří se upozornění. Pokud je text větší než 50 000 znaků, analyzuje se pouze prvních 50 000 znaků a zobrazí se upozornění.