Condividi tramite


Come usare l'editor di trascrizione online

L'editor della trascrizione online consente di creare o modificare trascrizioni audio con trascrizione letterale per riconoscimento vocale personalizzato. I casi d'uso principali dell'editor sono i seguenti:

  • Si dispone solo di dati audio, ma si desidera costruire da zero set di dati audio con etichettatura effettuata manualmente accurata da utilizzare nel training del modello.
  • Sono già presenti set di dati audio e con etichettatura effettuata manualmente, ma nella trascrizione sono presenti errori o difetti. L'editor consente di modificare rapidamente le trascrizioni per ottenere una migliore accuratezza del training.

L'unico requisito per usare l'editor di trascrizione consiste nell'avere dati audio caricati, con o senza trascrizioni corrispondenti.

È possibile trovare la scheda Editor accanto alla scheda Set di dati di training e test nella pagina principale Set di dati Voce.

Screenshot della pagina Set di dati voce che mostra la scheda Editor.

Non è possibile aggiornare i set di dati nella scheda Set di dati di training e test. È possibile importare una copia di un set di dati di training o test nella scheda Editor, aggiungere o modificare trascrizioni letterali in modo che corrispondano all'audio e quindi esportare il set di dati modificato nella scheda Set di dati di training e test. Si noti anche che non è possibile usare un set di dati incluso nell'editor per eseguire il training o il test di un modello.

Importare il set di dati nell'editor

Per importare un set di dati nell'editor, seguire questa procedura:

  1. Accedere a Speech Studio.
  2. Selezionare Riconoscimento vocale personalizzato> Nome progetto >Set di dati di Voce>Editor.
  3. Selezionare Importa dati
  4. Selezionare i set di dati. È possibile selezionare solo dati audio, audio e dati con etichettatura effettuata manualmente o entrambi. Per i dati solo audio, è possibile usare i modelli predefiniti per generare automaticamente la trascrizione del computer dopo l'importazione nell'editor.
  5. Immettere un nome e una descrizione per il nuovo set di dati, quindi selezionare Avanti.
  6. Esaminare le impostazioni e quindi selezionare Importa e chiudere per avviare il processo di importazione. Dopo l'importazione dei dati, è possibile selezionare i set di dati e avviare la modifica.

Nota

È anche possibile selezionare un set di dati dalla pagina principaleSet di dati Voce ed esportarli nell'editor. Selezionare un set di dati e quindi selezionare Esportare nell'editor.

Modificare la trascrizione in modo che corrisponda all'audio

Dopo aver importato un set di dati nell'editor, è possibile iniziare a modificare il set di dati. È possibile aggiungere o modificare trascrizioni letterali in modo che corrispondano all'audio durante l'ascolto. I dati audio non vengono modificati.

Per modificare la trascrizione di un set di dati nell'editor, seguire questa procedura:

  1. Accedere a Speech Studio.
  2. Selezionare Riconoscimento vocale personalizzato> Nome progetto >Set di dati di Voce>Editor.
  3. Selezionare il collegamento a un set di dati in base al nome.
  4. Nella tabella file audio e di testo selezionare il collegamento a un file audio in base al nome.
  5. Dopo aver apportato modifiche, selezionare Salva.

Se sono presenti più file nel set di dati, è possibile selezionare Precedente e Successivo per passare da un file all'altro. Modificare e salvare le modifiche apportate a ogni file man mano che si procede.

La pagina dei dettagli elenca tutti i segmenti in ogni file audio ed è possibile selezionare l'espressione desiderata. Per ogni espressione, è possibile riprodurre e confrontare l'audio con la trascrizione corrispondente. Modificare le trascrizioni se vengono visualizzati errori di inserimento, eliminazione o sostituzione. Per altre informazioni sui tipi di errore delle parole, vedere Modello di test quantitativo.

Esportare set di dati dall'editor

I set di dati nell'editor possono essere esportati nella scheda Set di dati di training e test, in cui possono essere usati per eseguire il training o il test di un modello.

Per esportare set di dati dall'editor, seguire questa procedura:

  1. Accedere a Speech Studio.
  2. Selezionare Riconoscimento vocale personalizzato> Nome progetto >Set di dati di Voce>Editor.
  3. Selezionare il collegamento a un set di dati in base al nome.
  4. Selezionare una o più righe dalla tabella File audio e di testo tabella.
  5. Selezionare Esportare per esportare tutti i file selezionati come un nuovo set di dati.

I file vengono esportati come nuovo set di dati e non avranno alcun impatto né sostituiranno altri set di dati di training o test.

Passaggi successivi