Come usare l'editor di trascrizione online
L'editor della trascrizione online consente di creare o modificare trascrizioni audio con trascrizione letterale per riconoscimento vocale personalizzato. I casi d'uso principali dell'editor sono i seguenti:
- Si dispone solo di dati audio, ma si desidera costruire da zero set di dati audio con etichettatura effettuata manualmente accurata da utilizzare nel training del modello.
- Sono già presenti set di dati audio e con etichettatura effettuata manualmente, ma nella trascrizione sono presenti errori o difetti. L'editor consente di modificare rapidamente le trascrizioni per ottenere una migliore accuratezza del training.
L'unico requisito per usare l'editor di trascrizione consiste nell'avere dati audio caricati, con o senza trascrizioni corrispondenti.
È possibile trovare la scheda Editor accanto alla scheda Set di dati di training e test nella pagina principale Set di dati Voce.
Non è possibile aggiornare i set di dati nella scheda Set di dati di training e test. È possibile importare una copia di un set di dati di training o test nella scheda Editor, aggiungere o modificare trascrizioni letterali in modo che corrispondano all'audio e quindi esportare il set di dati modificato nella scheda Set di dati di training e test. Si noti anche che non è possibile usare un set di dati incluso nell'editor per eseguire il training o il test di un modello.
Importare il set di dati nell'editor
Per importare un set di dati nell'editor, seguire questa procedura:
- Accedere a Speech Studio.
- Selezionare Riconoscimento vocale personalizzato> Nome progetto >Set di dati di Voce>Editor.
- Selezionare Importa dati
- Selezionare i set di dati. È possibile selezionare solo dati audio, audio e dati con etichettatura effettuata manualmente o entrambi. Per i dati solo audio, è possibile usare i modelli predefiniti per generare automaticamente la trascrizione del computer dopo l'importazione nell'editor.
- Immettere un nome e una descrizione per il nuovo set di dati, quindi selezionare Avanti.
- Esaminare le impostazioni e quindi selezionare Importa e chiudere per avviare il processo di importazione. Dopo l'importazione dei dati, è possibile selezionare i set di dati e avviare la modifica.
Nota
È anche possibile selezionare un set di dati dalla pagina principaleSet di dati Voce ed esportarli nell'editor. Selezionare un set di dati e quindi selezionare Esportare nell'editor.
Modificare la trascrizione in modo che corrisponda all'audio
Dopo aver importato un set di dati nell'editor, è possibile iniziare a modificare il set di dati. È possibile aggiungere o modificare trascrizioni letterali in modo che corrispondano all'audio durante l'ascolto. I dati audio non vengono modificati.
Per modificare la trascrizione di un set di dati nell'editor, seguire questa procedura:
- Accedere a Speech Studio.
- Selezionare Riconoscimento vocale personalizzato> Nome progetto >Set di dati di Voce>Editor.
- Selezionare il collegamento a un set di dati in base al nome.
- Nella tabella file audio e di testo selezionare il collegamento a un file audio in base al nome.
- Dopo aver apportato modifiche, selezionare Salva.
Se sono presenti più file nel set di dati, è possibile selezionare Precedente e Successivo per passare da un file all'altro. Modificare e salvare le modifiche apportate a ogni file man mano che si procede.
La pagina dei dettagli elenca tutti i segmenti in ogni file audio ed è possibile selezionare l'espressione desiderata. Per ogni espressione, è possibile riprodurre e confrontare l'audio con la trascrizione corrispondente. Modificare le trascrizioni se vengono visualizzati errori di inserimento, eliminazione o sostituzione. Per altre informazioni sui tipi di errore delle parole, vedere Modello di test quantitativo.
Esportare set di dati dall'editor
I set di dati nell'editor possono essere esportati nella scheda Set di dati di training e test, in cui possono essere usati per eseguire il training o il test di un modello.
Per esportare set di dati dall'editor, seguire questa procedura:
- Accedere a Speech Studio.
- Selezionare Riconoscimento vocale personalizzato> Nome progetto >Set di dati di Voce>Editor.
- Selezionare il collegamento a un set di dati in base al nome.
- Selezionare una o più righe dalla tabella File audio e di testo tabella.
- Selezionare Esportare per esportare tutti i file selezionati come un nuovo set di dati.
I file vengono esportati come nuovo set di dati e non avranno alcun impatto né sostituiranno altri set di dati di training o test.