Introduzione all'analisi del testo

Completato

Lingua di Azure AI fa pare dell'offerta di Servizi di Azure AI, che consente di eseguire l'elaborazione avanzata del linguaggio naturale su testo non strutturato. Le funzionalità di analisi del testo del linguaggio di intelligenza artificiale di Azure includono:

  • Il riconoscimento delle entità denominate identifica persone, luoghi, eventi e altro ancora. Questa funzionalità può anche essere personalizzata per estrarre categorie personalizzate.
  • Il collegamento di entità identifica le entità note insieme a un collegamento a Wikipedia.
  • Il rilevamento delle informazioni personali (PII) identifica le informazioni sensibili personali, incluse le informazioni sanitarie personali (PHI).
  • Il rilevamento della lingua identifica la lingua del testo e restituisce un codice di lingua, ad esempio "en" per l'inglese.
  • L’analisi della valutazione e l’opinion mining identifica se il testo è positivo o negativo.
  • Il riepilogo riepiloga il testo identificando le informazioni più importanti.
  • L'estrazione di frasi chiave elenca i concetti principali di un testo non strutturato.

Riconoscimento e collegamento di entità

Fornendo al servizio Lingua di Azure AI un testo non strutturato, verrà restituito un elenco di entità nel testo riconosciuto. Un'entità è un elemento di un tipo o di una categoria particolare e, in alcuni casi, di un sottotipo, ad esempio quelli illustrati nella tabella seguente.

Tipo Sottotipo Esempio
Person "Bill Gates", "Giovanni"
Titolo "Parigi", "New York"
Organizzazione "Microsoft"
Quantity Numero "6" o "sei"
Quantity Percentuale "25%" o "cinquanta percento"
Quantity Ordinale "1°" o "primo"
Quantity Età "90 giorni" o "30 anni"
Quantity Valuta "10,99"
Quantity Dimensione "10 miglia", "40 cm"
Quantity Temperatura "45°"
Data/Ora "18:30 4 febbraio 2012"
Data/Ora Data "2 maggio 2017" o "5/2/2017"
Data/Ora Ora "8 am" o "8:00"
Data/Ora DateRange "Dal 2 al 5 maggio"
Data/Ora Intervallo di tempo "dalle 18 alle 19"
Data/Ora Durata "1 minuto e 45 secondi"
Data/Ora Set "ogni martedì"
URL "https://www.bing.com"
E-mail "support@microsoft.com"
Numero di telefono negli Stati Uniti "(312) 555-0176"
Indirizzo IP "10.0.1.125"

Il servizio Lingua di Azure AI supporta inoltre il collegamento di entità per evitare ambiguità tra le entità tramite il collegamento a un riferimento specifico. Per le entità riconosciute, il servizio restituisce un URL per un articolo di Wikipedia rilevante.

Si supponga ad esempio di usare il servizio Lingua di Azure AI per rilevare le entità nell'estratto della recensione di ristorante seguente:

"Ho mangiato al ristorante a Seattle la settimana scorsa."

Entità Tipo Sottotipo URL Wikipedia
Seattle Titolo https://en.wikipedia.org/wiki/Seattle
settimana scorsa Data/Ora DateRange

Rilevamento lingua

Usare la funzionalità di rilevamento della lingua del servizio Lingua di Azure AI per identificare la lingua in cui è scritto il testo. È possibile inviare più documenti alla volta per l'analisi. Per ogni documento inviato, il servizio rileverà:

  • Il nome della lingua (ad esempio "Inglese").
  • Il codice ISO 639-1 della lingua (ad esempio, "en").
  • Un punteggio che indica un livello di confidenza nel rilevamento della lingua.

Si consideri, ad esempio, uno scenario in cui si è proprietari e si gestisce un ristorante in cui i clienti possono completare i sondaggi e fornire commenti e suggerimenti su cibo, servizio, personale e così via. Si supponga di aver ricevuto le seguenti recensioni da parte dei clienti:

Recensione 1: "A fantastic place for lunch. The soup was delicious."

Recensione 2: "Comida maravillosa y gran servicio."

Recensione 3: "The croque monsieur avec frites was terrific. Bon appetit!"

Puoi usare le funzionalità di analisi del testo nel servizio Lingua di Azure AI per rilevare la lingua per ognuna di queste recensioni. Si potrebbero ottenere i risultati seguenti:

Documento Nome della lingua Codice ISO 6391 Punteggio
Recensione 1 English en 1.0
Recensione 2 Spagnolo es 1.0
Recensione 3 English en 0.9

Si noti che la lingua rilevata per la recensione 3 è l'inglese, nonostante il testo contenga una combinazione di inglese e francese. Il servizio di rilevamento della lingua si concentrerà sulla lingua predominante nel testo. Il servizio usa un algoritmo per determinare la lingua predominante, ad esempio la lunghezza delle frasi o la quantità totale di testo per la lingua rispetto ad altre lingue nel testo. La lingua predominante sarà il valore restituito, insieme al codice della lingua. Il Punteggio di confidenza può essere minore di 1 come risultato del testo in lingua mista.

Potrebbe essere presente un testo di natura ambigua o con contenuto in lingue miste. Queste situazioni possono rappresentare un problema. Un esempio di contenuto ambiguo potrebbe essere un caso in cui il documento contiene testo limitato o solo punteggiatura. Se ad esempio si usa il servizio Lingua di Azure AI per analizzare il testo ":-)", vengono restituiti il valore sconosciuto per il nome della lingua e l'identificatore lingua, nonché un punteggio NaN (acronimo di Not a Number, non un numero).

Analisi del sentiment e opinion mining

Le funzionalità di analisi del testo nel servizio Lingua di Azure AI possono valutare il testo e restituire i punteggi e le etichette del sentiment per ogni frase. Questa funzionalità è utile per rilevare il sentiment positivo e negativo nei social media, nelle recensioni dei clienti, nei forum di discussione e altro ancora.

Lingua di Azure AI usa un modello di classificazione predefinito di apprendimento automatico per valutare il testo. Il servizio restituisce i punteggi della valutazione in tre categorie: positivo, neutro e negativo. In ognuna delle categorie viene fornito un punteggio compreso tra 0 e 1. I punteggi indicano la probabilità che il testo fornito corrisponda a una valutazione particolare. Viene inoltre fornita una valutazione del documento.

Ad esempio, le due recensioni di ristoranti seguenti possono essere analizzate per il sentiment:

Recensione 1: "Abbiamo cenato in questo ristorante la notte scorsa e la prima cosa che ho notato è stata la cortesia del personale. Siamo stati accolti cordialmente e siamo stati portati subito al nostro tavolo. Il tavolo era pulito, le sedie erano comode e il cibo era straordinario."

e

Recensione 2: "La nostra esperienza a cena in questo ristorante è stata una delle peggiori che abbia mai avuto. Il servizio è stato lento e il cibo era terribile. Non mangerò più in questo posto."

Il punteggio della valutazione per la prima recensione potrebbe essere: Valutazione del documento: punteggio positivo: .90 punteggio neutro: .10 punteggio negativo: .00

La seconda revisione potrebbe restituire una risposta: Valutazione del documento: punteggio positivo: .00 punteggio neutro: .00 punteggio negativo: .99

Estrazione frasi chiave

L'estrazione di frasi chiave identifica i punti principali del testo. Si consideri lo scenario del ristorante illustrato in precedenza. Se disponi di un numero elevato di sondaggi, leggere le recensioni può richiedere molto tempo. Al contrario, è possibile usare le funzionalità di estrazione di frasi chiave del servizio Lingua per riepilogare i punti principali.

Si potrebbe ricevere una recensione come:

"Abbiamo cenato qui per festeggiare un compleanno ed è stata un'esperienza fantastica. Siamo stati accolti da una cameriera gentile e siamo stati portati subito al nostro tavolo. L'ambiente era rilassato, il cibo era straordinario e il servizio era formidabile. Se si vuole gustare cibo squisito con un servizio cortese, questo posto è da provare."

L'estrazione di frasi chiave può fornire un contesto a questa recensione estraendo le frasi seguenti:

  • festeggiare un compleanno
  • esperienza fantastica
  • cameriera gentile
  • cibo squisito
  • servizio cortese
  • cena
  • table
  • ambiente
  • posto

Oltre a usare l'analisi della valutazione per determinare che si tratti di una recensione positiva, puoi anche usare il servizio di frasi chiave per identificare gli elementi importanti della recensione.

Crea una risorsa per il linguaggio di intelligenza artificiale di Azure

Per usare il servizio Lingua di Azure AI in un'applicazione, è necessario effettuare il provisioning di una risorsa appropriata nella sottoscrizione di Azure. Puoi scegliere uno dei tipi di risorsa seguenti:

  • Una risorsa Lingua: scegli questo tipo di risorsa se prevedi di usare solo i servizi Lingua di Azure AI o se vuoi gestire l'accesso e la fatturazione per la risorsa separatamente da altri servizi.
  • Una risorsa Servizi di Azure AI: scegliere questo tipo di risorsa se si prevede di usare il servizio Lingua di Azure AI in combinazione con altri servizi di Azure AI e si vogliono gestire l'accesso e la fatturazione per questi servizi insieme.