Condividi tramite


Estrarre frasi chiave dal testo

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Estrae frasi chiave dal testo specificato

Categoria: Analisi del testo

Nota

Si applica a: Machine Learning Studio (versione classica)

Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.

Panoramica del modulo

Questo articolo illustra come usare il modulo Estrai frasi chiave da testo in Machine Learning Studio (versione classica) per pre-elaborare una colonna di testo. Data una colonna di testo in linguaggio naturale, il modulo estrae una o più frasi significative. Una frase può essere una singola parola, un sostantivo composto o un modificatore più un sostantivo.

Questo modulo è un wrapper per le API di elaborazione del linguaggio naturale per l'estrazione di frasi chiave. Le frasi vengono analizzate come potenzialmente significative nel contesto della frase per vari motivi:

  • La frase acquisisce l'argomento della frase.
  • La frase contiene una combinazione di modificatore e sostantivo che indica il sentiment.

Si supponga, ad esempio, che la frase analizzata sia: "È stato un hotel straordinario in cui alloggiare, con un'esperienza unica e un personale gentile".

Il modulo Estrai frasi chiave da testo potrebbe restituire queste frasi chiave:

  • hotel straordinario
  • personale gentile
  • decorazione univoca

Come configurare l'estrazione di frasi chiave dal testo

Per estrarre frasi chiave, è necessario connettere un set di dati con una colonna di testo.

  1. Aggiungere il modulo Estrai frasi chiave da testo all'esperimento in Machine Learning Studio (versione classica). Connettere quindi un set di dati con almeno una colonna full-text.

  2. Usare il selettore di colonna per selezionare una colonna di tipo stringa da cui estrarre le frasi chiave.

  3. In Lingua selezionare una lingua da usare per l'analisi delle frasi. Se si specifica una lingua, verranno restituite solo le frasi nella lingua di destinazione.

  4. Se la colonna di testo contiene frasi in più lingue, scegliere l'opzione Lingua identificata nelle colonne. Viene visualizzato un nuovo selettore di colonna che consente di selezionare una colonna nel set di dati contenente un identificatore di lingua. L'identificatore della lingua può essere il nome della lingua o l'identificatore delle impostazioni cultura Iso6391. Ad esempio, "English" o "en" sono accettabili.

    Suggerimento

    Prima di eseguire estrai frasi chiave dal testo, usare il modulo Rileva lingue per identificare la lingua in ogni riga e generare l'identificatore automaticamente. Viene generato un errore se la colonna dell'identificatore di lingua contiene lingue non supportate da Estrai frasi chiave da testo.

Risultati

L'output del modulo è un set di dati contenente una colonna di frasi chiave separate da virgole.

Ad esempio, i risultati di esempio seguenti sono per un set di dati di input contenente revisioni in più lingue:

Frasi chiave
novel, atomica, buon libro, storia di avventura, valanga di eventi, buoni personaggi
primer misterio,personajes,fan,aventura,isla
  • Tutte le frasi di output sono contenute in una singola colonna. non vengono passate altre colonne e non viene aggiunto un identificatore. Tuttavia, se si desidera allineare le frasi di output al testo di origine, è possibile ricombinare le frasi di output con l'input usando il modulo Aggiungi colonne.

  • L'output dell'estrazione di frasi chiave non contrassegna la lingua delle singole frasi.

  • Se viene inclusa una lingua non supportata dal modulo Estrai frasi chiave , viene generato un errore (0039). Per evitare errori, assicurarsi di filtrare il testo di input con un identificatore di lingua incompatibile.

    Se sono presenti poche righe di altre lingue, è anche possibile evitare l'errore omettendo l'identificatore di lingua e analizzando tutto il testo usando una singola selezione della lingua. Tuttavia, quando si esegue questa operazione, i risultati sono molto scarsi, perché intere frasi nelle altre lingue potrebbero essere restituite come una singola frase chiave.

Esempio

L'esempio seguente illustra come usare questo modulo per estrarre frasi chiave e quindi creare un cloud di parole dalle frasi: Estrai frasi chiave e Mostra word cloud

Vedere l'Azure AI Gallery per altri esempi di elaborazione del testo usando Machine Learning.

Note tecniche

Questo modulo supporta attualmente le lingue seguenti:

  • Olandese
  • Inglese
  • Francese
  • Tedesco
  • Italiano
  • Spagnolo

Per altre lingue, è consigliabile usare l'API Analisi del testo in Servizi cognitivi di Azure. Per altre informazioni, vedere Come estrarre frasi chiave in Analisi del testo

Input previsti

Nome Tipo Descrizione
Set di dati Tabella dati Tabella contenente il testo da elaborare.

Parametri del modulo

Nome Tipo Intervallo Facoltativo Predefinito Descrizione
Colonna Lingua delle impostazioni cultura ColumnSelection language:Column contiene la lingua Nome o indice in base uno della colonna contenente le informazioni sulla lingua delle impostazioni cultura
Colonna di testo ColumnSelection Necessario Nome o indice in base uno della colonna di testo.
Linguaggio T_Language Inglese, spagnolo, francese, olandese, tedesco, italiano, colonna contiene la lingua Necessario Inglese Selezionare la lingua del testo da elaborare.

Output

Nome Tipo Descrizione
Set di dati di risultati Tabella dati Frasi chiave estratte

Eccezioni

Eccezione Descrizione
Errore 0003 L'eccezione si verifica se uno o più input sono null o vuoti.
Errore 0010 L'eccezione si verifica se i nomi di colonna nei set di dati di input non corrispondono, mentre dovrebbero essere corrispondenti.
Errore 0016 L'eccezione si verifica se i tipi di colonna dei set di dati di input passati al modulo dovrebbero essere compatibili ma non lo sono.
Errore 0008 L'eccezione si verifica se il parametro non rientra nell'intervallo.

Per un elenco degli errori specifici dei moduli di Studio (versione classica), vedere Machine Learning codici di errore.

Per un elenco delle eccezioni API, vedere Machine Learning di errore dell'API REST.

Vedi anche

Analisi del testo
Elenco moduli A-Z