Competenza Estrazione frasi chiave della ricerca cognitiva
La competenza Estrazione frasi chiave valuta il testo non strutturato e restituisce un elenco di frasi chiave per ciascun record. Questa competenza usa i modelli di Machine Learning frasi chiave forniti dal linguaggio di intelligenza artificiale di Azure.
Questa funzionalità è utile se occorre identificare rapidamente i punti di discussione principali nel record. Ad esempio, dato il testo di input "Il cibo era delizioso e il personale era meraviglioso", il servizio restituisce "cibo" e "personale meraviglioso".
Nota
Questa competenza è associata ai servizi di intelligenza artificiale di Azure e richiede una risorsa fatturabile per le transazioni che superano 20 documenti per indicizzatore al giorno. L'esecuzione delle competenze predefinite viene addebitata secondo gli attuali prezzi con pagamento in base al consumo dei Servizi di Azure AI.
@odata.type
Microsoft.Skills.Text.KeyPhraseExtractionSkill
Limiti dei dati
Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length
. Se è necessario suddividere i dati prima di inviarli all'estrattore di frasi chiave, è possibile usare la competenza Divisione del testo. Se si usa una competenza di suddivisione del testo, impostare la lunghezza della pagina su 5000 per ottenere prestazioni ottimali.
Parametri della competenza
I parametri fanno distinzione tra maiuscole e minuscole.
Input | Descrizione |
---|---|
defaultLanguageCode |
(Facoltativo) Il codice lingua da applicare ai documenti che non specificano in modo esplicito una lingua. Se il codice di lingua predefinito non è specificato, l'inglese (en) viene usato come codice di lingua predefinito. Vedi l'elenco completo di linguaggi supportati. |
maxKeyPhraseCount |
(Facoltativo) Il numero massimo di frasi chiave da produrre. |
modelVersion |
(Facoltativo) Specifica la versione del modello da usare quando si chiama l'API della frase chiave. Per impostazione predefinita, la versione più recente disponibile quando non è specificata. È consigliabile non specificare questo valore a meno che non sia necessario. |
Input competenze
Input | Descrizione |
---|---|
text |
Testo da analizzare. |
languageCode |
Stringa che indica la lingua dei record. Se questo parametro non viene specificato, il codice di lingua predefinito viene usato per analizzare i record. Vedi l'elenco completo di linguaggi supportati. |
Output competenze
Output | Descrizione |
---|---|
keyPhrases |
Elenco di frasi chiave estratte dal testo di input. Le frasi chiave vengono restituite in ordine di importanza. |
Definizione di esempio
Si consideri un record SQL con i campi seguenti:
{
"content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
"language": "en"
}
La definizione della competenza potrebbe essere simile alla seguente:
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "myKeyPhrases"
}
]
}
Output di esempio
Per l'esempio precedente, l'output della competenza viene scritto in un nuovo nodo nell'albero arricchito denominato "document/myKeyPhrases" perché è quello targetName
specificato. Se non si specifica un oggetto targetName
, sarà "document/keyPhrases".
document/myKeyPhrases
[
"world’s glaciers",
"huge rivers of ice",
"Canadian Rockies",
"iconic landscapes",
"Mount Everest region",
"Continued warming"
]
È possibile usare "document/myKeyPhrases" come input in altre competenze o come origine di un mapping dei campi di output.
Avvisi
Se si specifica un codice linguistico non supportato, viene generato un avviso e le frasi chiave non vengono estratte. Se il testo è vuoto, viene generato un avviso. Se il testo è maggiore di 50.000 caratteri, vengono analizzati solo i primi 50.000 caratteri e viene generato un avviso.