Avvio rapido per la creazione di una parola chiave personalizzata - Servizio Voce - Azure AI services

Documentazione di riferimento | Pacchetto (NuGet) | Ulteriori esempi in GitHub

In questo argomento di avvio vengono fornite le nozioni di base sull'uso di parole chiave personalizzate. Una parola chiave è costituita da una parola o una frase breve che consente l'attivazione vocale di un prodotto. In Speech Studio è possibile creare modelli di parole chiave, nonché esportare un file di modello usato con Speech SDK nelle applicazioni in uso.

Prerequisiti

Una sottoscrizione di Azure. È possibile crearne uno gratuitamente.
Creare una risorsa di Servizi di intelligenza artificiale per il riconoscimento vocale nella portale di Azure.
Ottenere la chiave e l'area della risorsa Voce. Dopo aver distribuito la risorsa Voce, selezionare Vai alla risorsa per visualizzare e gestire le chiavi.

Creare una parola chiave in Speech Studio

Prima di poter usare una parola chiave personalizzata, è necessario creare una parola chiave tramite la pagina Parola chiave personalizzata disponibile in Speech Studio. Dopo aver specificato una parola chiave, viene generato un file .table che è possibile usare con Speech SDK.

Importante

I modelli di parole chiave personalizzati, e i file .table risultanti, possono essere creati solo in Speech Studio. Non è possibile creare parole chiave personalizzate dall'SDK o con chiamate REST.

Passare a Speech Studio ed eseguire l'accesso. Se non si ha una sottoscrizione a un servizio Voce, passare a Creare servizi Voce.
Nella pagina Parola chiave personalizzata selezionare Crea un nuovo progetto.
Compilare i campi Nome, Descrizione e Lingua per il progetto di parola chiave personalizzata. È possibile scegliere una sola lingua per progetto e il supporto è attualmente limitato all'inglese (Stati Uniti) e al cinese (mandarino, semplificato).
Selezionare il nome del progetto nell'elenco.
Per creare una parola chiave personalizzata per l'assistente virtuale, selezionare Crea un nuovo modello.
Immettere un Nome per il modello, una Descrizione e una Parola chiave a scelta, quindi selezionare Avanti. Vedere le indicazioni relative alla scelta di una parola chiave efficace.
Il portale crea possibili pronunce candidate per la parola chiave. Ascoltare ogni pronuncia candidata selezionando il relativo pulsante di riproduzione e rimuovere il segno di spunta accanto a ogni pronuncia non corretta. Selezionare tutte le pronunce che corrispondono a come si prevede che gli utenti pronunciano la parola chiave e quindi selezionare Avanti per iniziare a generare il modello di parola chiave.
Selezionare un tipo di modello, quindi selezionare Crea. È possibile visualizzare un elenco di aree che supportano il tipo di modello Advanced nella documentazione di supporto della regione di riconoscimento delle parole chiave.
A causa di una domanda elevata, il training del modello di base potrebbe richiedere diverse ore. Il training del modello avanzato potrebbe richiedere fino a un giorno. Lo stato passa da Elaborazione a Operazione completata al completamento del training.
Nel menu a comparsa a sinistra selezionare Ottimizzazione per accedere alle opzioni che consentono di ottimizzare e scaricare il modello. Il file scaricato è un archivio di tipo .zip. Estrarre l'archivio; verrà visualizzato un file con estensione .table. Usare il file .table con l'SDK e prendere nota del percorso.

Usare un modello di parola chiave con Speech SDK

Per prima cosa, caricare il file del modello di parola chiave usando la funzione statica FromFile(), che restituisce un oggetto KeywordRecognitionModel. Usare il percorso del file .table scaricato da Speech Studio. Creare inoltre un oggetto AudioConfig usando il microfono predefinito e quindi creare un'istanza di un nuovo oggetto KeywordRecognizer usando la configurazione audio.

using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;

var keywordModel = KeywordRecognitionModel.FromFile("your/path/to/Activate_device.table");
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var keywordRecognizer = new KeywordRecognizer(audioConfig);

Importante

Se si preferisce testare un modello di parole chiave direttamente con campioni audio tramite il metodo AudioConfig.fromStreamInput(), assicurarsi di usare campioni con almeno 1,5 secondi di silenzio prima della prima parola chiave. Ciò serve a fornire un tempo adeguato per il motore di riconoscimento delle parole chiave per inizializzare e ottenere lo stato di ascolto prima di rilevare la prima parola chiave.

A questo punto, è possibile eseguire il riconoscimento della parola chiave con una chiamata a RecognizeOnceAsync() passando l'oggetto modello. Questo metodo avvia una sessione di riconoscimento della parola chiave che terminerà solo nel momento in cui verrà riconosciuta la parola chiave. In genere, quindi, si usa questo schema progettuale nelle applicazioni multithread o nei casi d'uso in cui potrebbe essere necessario attendere una parola di riattivazione per un tempo indefinito.

KeywordRecognitionResult result = await keywordRecognizer.RecognizeOnceAsync(keywordModel);

Nota

L'esempio sopra riportato usa il riconoscimento di una parola chiave locale, poiché non richiede un oggetto SpeechConfig per il contesto di autenticazione e non contatta il back-end.

Riconoscimento continuo

Altre classi in Speech SDK supportano il riconoscimento continuo (che include il riconoscimento vocale e delle finalità) tramite la funzione di riconoscimento della parole chiave. Questo SDK modo è possibile usare lo stesso codice solitamente usato per il riconoscimento continuo, con la possibilità di fare riferimento a un file .table per il modello di parola chiave.

Per la conversione della voce in testo scritto, seguire lo stesso schema progettuale illustrato nella guida al riconoscimento vocale per configurare il riconoscimento continuo. Sostituire quindi la chiamata a recognizer.StartContinuousRecognitionAsync() con recognizer.StartKeywordRecognitionAsync(KeywordRecognitionModel) e passare l'oggetto KeywordRecognitionModel. Per interrompere il riconoscimento continuo con riconoscimento della parole chiave, usare recognizer.StopKeywordRecognitionAsync() anziché recognizer.StopContinuousRecognitionAsync().

Il riconoscimento delle finalità usa uno schema identico con le funzioni StartKeywordRecognitionAsync e StopKeywordRecognitionAsync.

Documentazione di riferimento | Pacchetto (NuGet) | Ulteriori esempi in GitHub

Speech SDK per C++ supporta il riconoscimento della parola chiave, ma la relativa guida non è ancora inclusa in questa documentazione. Selezionare un altro linguaggio di programmazione per iniziare e ottenere informazioni sui concetti oppure vedere le informazioni di riferimento e gli esempi C++ tramite i collegamenti all'inizio dell'articolo.

author: eric-urban ms.service: azure-ai-speech ms.topic: include ms.date: 12/9/2024 ms.author: eur

Una sottoscrizione di Azure. È possibile crearne uno gratuitamente.
Creare una risorsa di Servizi di intelligenza artificiale per il riconoscimento vocale nella portale di Azure.
Ottenere la chiave e l'area della risorsa Voce. Dopo aver distribuito la risorsa Voce, selezionare Vai alla risorsa per visualizzare e gestire le chiavi.

Creare una parola chiave in Speech Studio

Prima di poter usare una parola chiave personalizzata, è necessario creare una parola chiave tramite la pagina Parola chiave personalizzata disponibile in Speech Studio. Dopo aver specificato una parola chiave, viene generato un file .table che è possibile usare con Speech SDK.

Importante

I modelli di parole chiave personalizzati, e i file .table risultanti, possono essere creati solo in Speech Studio. Non è possibile creare parole chiave personalizzate dall'SDK o con chiamate REST.

Passare a Speech Studio ed eseguire l'accesso. Se non si ha una sottoscrizione a un servizio Voce, passare a Creare servizi Voce.
Nella pagina Parola chiave personalizzata selezionare Crea un nuovo progetto.
Compilare i campi Nome, Descrizione e Lingua per il progetto di parola chiave personalizzata. È possibile scegliere una sola lingua per progetto e il supporto è attualmente limitato all'inglese (Stati Uniti) e al cinese (mandarino, semplificato).
Selezionare il nome del progetto nell'elenco.
Per creare una parola chiave personalizzata per l'assistente virtuale, selezionare Crea un nuovo modello.
Immettere un Nome per il modello, una Descrizione e una Parola chiave a scelta, quindi selezionare Avanti. Vedere le indicazioni relative alla scelta di una parola chiave efficace.
Il portale crea possibili pronunce candidate per la parola chiave. Ascoltare ogni pronuncia candidata selezionando il relativo pulsante di riproduzione e rimuovere il segno di spunta accanto a ogni pronuncia non corretta. Selezionare tutte le pronunce che corrispondono a come si prevede che gli utenti pronunciano la parola chiave e quindi selezionare Avanti per iniziare a generare il modello di parola chiave.
Selezionare un tipo di modello, quindi selezionare Crea. È possibile visualizzare un elenco di aree che supportano il tipo di modello Advanced nella documentazione di supporto della regione di riconoscimento delle parole chiave.
A causa di una domanda elevata, il training del modello di base potrebbe richiedere diverse ore. Il training del modello avanzato potrebbe richiedere fino a un giorno. Lo stato passa da Elaborazione a Operazione completata al completamento del training.
Nel menu a comparsa a sinistra selezionare Ottimizzazione per accedere alle opzioni che consentono di ottimizzare e scaricare il modello. Il file scaricato è un archivio di tipo .zip. Estrarre l'archivio; verrà visualizzato un file con estensione .table. Usare il file .table con l'SDK e prendere nota del percorso.

Usare un modello di parola chiave con Speech SDK

Vedere la documentazione di riferimento per l'uso del modello di parola chiave personalizzata con Go SDK.

documentazione di riferimento | Esempi aggiuntivi in GitHub

Speech SDK per Java supporta il riconoscimento della parola chiave, ma la relativa guida non è ancora inclusa in questa documentazione. Selezionare un altro linguaggio di programmazione per iniziare e ottenere informazioni sui concetti oppure vedere le informazioni di riferimento e gli esempi Java tramite i collegamenti all'inizio dell'articolo.

Documentazione di riferimento | Pacchetto (npm) | Ulteriori esempi in GitHub | Codice sorgente della libreria

Il SDK per il Servizio cognitivo di Azure per la voce per JavaScript non supporta il riconoscimento della parola chiave. Selezionare un altro linguaggio di programmazione oppure vedere le informazioni di riferimento e gli esempi JavaScript tramite i collegamenti all'inizio dell'articolo.

Documentazione di riferimento | Pacchetto (download) | Ulteriori esempi in GitHub

In questo argomento di avvio vengono fornite le nozioni di base sull'uso di parole chiave personalizzate. Una parola chiave è costituita da una parola o una frase breve che consente l'attivazione vocale di un prodotto. In Speech Studio è possibile creare modelli di parole chiave, nonché esportare un file di modello usato con Speech SDK nelle applicazioni in uso.

Prerequisiti

Una sottoscrizione di Azure. È possibile crearne uno gratuitamente.
Creare una risorsa di Servizi di intelligenza artificiale per il riconoscimento vocale nella portale di Azure.
Ottenere la chiave e l'area della risorsa Voce. Dopo aver distribuito la risorsa Voce, selezionare Vai alla risorsa per visualizzare e gestire le chiavi.

Creare una parola chiave in Speech Studio

Prima di poter usare una parola chiave personalizzata, è necessario creare una parola chiave tramite la pagina Parola chiave personalizzata disponibile in Speech Studio. Dopo aver specificato una parola chiave, viene generato un file .table che è possibile usare con Speech SDK.

Importante

I modelli di parole chiave personalizzati, e i file .table risultanti, possono essere creati solo in Speech Studio. Non è possibile creare parole chiave personalizzate dall'SDK o con chiamate REST.

Passare a Speech Studio ed eseguire l'accesso. Se non si ha una sottoscrizione a un servizio Voce, passare a Creare servizi Voce.
Nella pagina Parola chiave personalizzata selezionare Crea un nuovo progetto.
Compilare i campi Nome, Descrizione e Lingua per il progetto di parola chiave personalizzata. È possibile scegliere una sola lingua per progetto e il supporto è attualmente limitato all'inglese (Stati Uniti) e al cinese (mandarino, semplificato).
Selezionare il nome del progetto nell'elenco.
Per creare una parola chiave personalizzata per l'assistente virtuale, selezionare Crea un nuovo modello.
Immettere un Nome per il modello, una Descrizione e una Parola chiave a scelta, quindi selezionare Avanti. Vedere le indicazioni relative alla scelta di una parola chiave efficace.
Il portale crea possibili pronunce candidate per la parola chiave. Ascoltare ogni pronuncia candidata selezionando il relativo pulsante di riproduzione e rimuovere il segno di spunta accanto a ogni pronuncia non corretta. Selezionare tutte le pronunce che corrispondono a come si prevede che gli utenti pronunciano la parola chiave e quindi selezionare Avanti per iniziare a generare il modello di parola chiave.
Selezionare un tipo di modello, quindi selezionare Crea. È possibile visualizzare un elenco di aree che supportano il tipo di modello Advanced nella documentazione di supporto della regione di riconoscimento delle parole chiave.
A causa di una domanda elevata, il training del modello di base potrebbe richiedere diverse ore. Il training del modello avanzato potrebbe richiedere fino a un giorno. Lo stato passa da Elaborazione a Operazione completata al completamento del training.
Nel menu a comparsa a sinistra selezionare Ottimizzazione per accedere alle opzioni che consentono di ottimizzare e scaricare il modello. Il file scaricato è un archivio di tipo .zip. Estrarre l'archivio; verrà visualizzato un file con estensione .table. Usare il file .table con l'SDK e prendere nota del percorso.

Usare un modello di parola chiave con Speech SDK

Vedere l'esempio in GitHub per capire come usare un modello di parola chiave personalizzata con Objective C SDK.

Documentazione di riferimento | Pacchetto (download) | Ulteriori esempi in GitHub

In questo argomento di avvio vengono fornite le nozioni di base sull'uso di parole chiave personalizzate. Una parola chiave è costituita da una parola o una frase breve che consente l'attivazione vocale di un prodotto. In Speech Studio è possibile creare modelli di parole chiave, nonché esportare un file di modello usato con Speech SDK nelle applicazioni in uso.

Prerequisiti

Una sottoscrizione di Azure. È possibile crearne uno gratuitamente.
Creare una risorsa di Servizi di intelligenza artificiale per il riconoscimento vocale nella portale di Azure.
Ottenere la chiave e l'area della risorsa Voce. Dopo aver distribuito la risorsa Voce, selezionare Vai alla risorsa per visualizzare e gestire le chiavi.

Creare una parola chiave in Speech Studio

Prima di poter usare una parola chiave personalizzata, è necessario creare una parola chiave tramite la pagina Parola chiave personalizzata disponibile in Speech Studio. Dopo aver specificato una parola chiave, viene generato un file .table che è possibile usare con Speech SDK.

Importante

I modelli di parole chiave personalizzati, e i file .table risultanti, possono essere creati solo in Speech Studio. Non è possibile creare parole chiave personalizzate dall'SDK o con chiamate REST.

Passare a Speech Studio ed eseguire l'accesso. Se non si ha una sottoscrizione a un servizio Voce, passare a Creare servizi Voce.
Nella pagina Parola chiave personalizzata selezionare Crea un nuovo progetto.
Compilare i campi Nome, Descrizione e Lingua per il progetto di parola chiave personalizzata. È possibile scegliere una sola lingua per progetto e il supporto è attualmente limitato all'inglese (Stati Uniti) e al cinese (mandarino, semplificato).
Selezionare il nome del progetto nell'elenco.
Per creare una parola chiave personalizzata per l'assistente virtuale, selezionare Crea un nuovo modello.
Immettere un Nome per il modello, una Descrizione e una Parola chiave a scelta, quindi selezionare Avanti. Vedere le indicazioni relative alla scelta di una parola chiave efficace.
Il portale crea possibili pronunce candidate per la parola chiave. Ascoltare ogni pronuncia candidata selezionando il relativo pulsante di riproduzione e rimuovere il segno di spunta accanto a ogni pronuncia non corretta. Selezionare tutte le pronunce che corrispondono a come si prevede che gli utenti pronunciano la parola chiave e quindi selezionare Avanti per iniziare a generare il modello di parola chiave.
Selezionare un tipo di modello, quindi selezionare Crea. È possibile visualizzare un elenco di aree che supportano il tipo di modello Advanced nella documentazione di supporto della regione di riconoscimento delle parole chiave.
A causa di una domanda elevata, il training del modello di base potrebbe richiedere diverse ore. Il training del modello avanzato potrebbe richiedere fino a un giorno. Lo stato passa da Elaborazione a Operazione completata al completamento del training.
Nel menu a comparsa a sinistra selezionare Ottimizzazione per accedere alle opzioni che consentono di ottimizzare e scaricare il modello. Il file scaricato è un archivio di tipo .zip. Estrarre l'archivio; verrà visualizzato un file con estensione .table. Usare il file .table con l'SDK e prendere nota del percorso.

Usare un modello di parola chiave con Speech SDK

Vedere l'esempio in GitHub per capire come usare un modello di parola chiave personalizzata con Objective C SDK. Sebbene non sia attualmente disponibile un esempio Swift per parità, i concetti sono simili.

Nota

Se si intende usare il riconoscimento delle parole chiave nell'applicazione Swift in iOS, si noti che i nuovi modelli di parole chiave creati in Speech Studio richiederanno l'uso del bundle Speech SDK xcframework da https://aka.ms/csspeech/iosbinaryembedded o del MicrosoftCognitiveServicesSpeechEmbedded-iOS pod nel progetto.

Documentazione di riferimento | Pacchetto (PyPi) | Ulteriori esempi in GitHub

In questo argomento di avvio vengono fornite le nozioni di base sull'uso di parole chiave personalizzate. Una parola chiave è costituita da una parola o una frase breve che consente l'attivazione vocale di un prodotto. In Speech Studio è possibile creare modelli di parole chiave, nonché esportare un file di modello usato con Speech SDK nelle applicazioni in uso.

Prerequisiti

Una sottoscrizione di Azure. È possibile crearne uno gratuitamente.
Creare una risorsa di Servizi di intelligenza artificiale per il riconoscimento vocale nella portale di Azure.
Ottenere la chiave e l'area della risorsa Voce. Dopo aver distribuito la risorsa Voce, selezionare Vai alla risorsa per visualizzare e gestire le chiavi.

Creare una parola chiave in Speech Studio

Prima di poter usare una parola chiave personalizzata, è necessario creare una parola chiave tramite la pagina Parola chiave personalizzata disponibile in Speech Studio. Dopo aver specificato una parola chiave, viene generato un file .table che è possibile usare con Speech SDK.

Importante

I modelli di parole chiave personalizzati, e i file .table risultanti, possono essere creati solo in Speech Studio. Non è possibile creare parole chiave personalizzate dall'SDK o con chiamate REST.

Passare a Speech Studio ed eseguire l'accesso. Se non si ha una sottoscrizione a un servizio Voce, passare a Creare servizi Voce.
Nella pagina Parola chiave personalizzata selezionare Crea un nuovo progetto.
Compilare i campi Nome, Descrizione e Lingua per il progetto di parola chiave personalizzata. È possibile scegliere una sola lingua per progetto e il supporto è attualmente limitato all'inglese (Stati Uniti) e al cinese (mandarino, semplificato).
Selezionare il nome del progetto nell'elenco.
Per creare una parola chiave personalizzata per l'assistente virtuale, selezionare Crea un nuovo modello.
Immettere un Nome per il modello, una Descrizione e una Parola chiave a scelta, quindi selezionare Avanti. Vedere le indicazioni relative alla scelta di una parola chiave efficace.
Il portale crea possibili pronunce candidate per la parola chiave. Ascoltare ogni pronuncia candidata selezionando il relativo pulsante di riproduzione e rimuovere il segno di spunta accanto a ogni pronuncia non corretta. Selezionare tutte le pronunce che corrispondono a come si prevede che gli utenti pronunciano la parola chiave e quindi selezionare Avanti per iniziare a generare il modello di parola chiave.
Selezionare un tipo di modello, quindi selezionare Crea. È possibile visualizzare un elenco di aree che supportano il tipo di modello Advanced nella documentazione di supporto della regione di riconoscimento delle parole chiave.
A causa di una domanda elevata, il training del modello di base potrebbe richiedere diverse ore. Il training del modello avanzato potrebbe richiedere fino a un giorno. Lo stato passa da Elaborazione a Operazione completata al completamento del training.
Nel menu a comparsa a sinistra selezionare Ottimizzazione per accedere alle opzioni che consentono di ottimizzare e scaricare il modello. Il file scaricato è un archivio di tipo .zip. Estrarre l'archivio; verrà visualizzato un file con estensione .table. Usare il file .table con l'SDK e prendere nota del percorso.

Usare un modello di parola chiave con Speech SDK

Vedere l'esempio in GitHub per capire come usare un modello di parola chiave personalizzata con Python SDK.

Informazioni di riferimento sull'API REST di riconoscimento vocale | Informazioni di riferimento sull'API REST di riconoscimento vocale per audio brevi | Ulteriori esempi in GitHub

L'API REST di riconoscimento vocale non supporta il riconoscimento della parola chiave. Selezionare un altro linguaggio di programmazione oppure vedere le informazioni di riferimento e gli esempi tramite i collegamenti all'inizio dell'articolo.

L'interfaccia della riga di comando del servizio Voce supporta il riconoscimento della parola chiave, ma la relativa guida non è ancora inclusa in questa documentazione. Selezionare un altro linguaggio di programmazione per iniziare e ottenere informazioni sui concetti.

Condividi tramite

Avvio rapido: Creare una parola chiave personalizzata

Prerequisiti

Creare una parola chiave in Speech Studio

Usare un modello di parola chiave con Speech SDK

Riconoscimento continuo

author: eric-urban ms.service: azure-ai-speech ms.topic: include ms.date: 12/9/2024 ms.author: eur

Creare una parola chiave in Speech Studio

Usare un modello di parola chiave con Speech SDK

Prerequisiti

Creare una parola chiave in Speech Studio

Usare un modello di parola chiave con Speech SDK

Prerequisiti

Creare una parola chiave in Speech Studio

Usare un modello di parola chiave con Speech SDK

Prerequisiti

Creare una parola chiave in Speech Studio

Usare un modello di parola chiave con Speech SDK

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive