Skapa ett tal för enstaka igenkänning till textprogram

Slutförd

I föregående övning lärde du dig hur du skapar ett Azure AI-tjänstkonto med hjälp av Azure CLI. Nu när du har ett Azure AI-tjänstkonto som du ska arbeta med kan du börja arbeta med ditt tal till text-program.

Din första utmaning är att skapa ett program som ditt företag kan använda för att transkribera de korta pm:erna från dina medicinska klienter. Azure AI-tjänster tillhandahåller två olika typer av taligenkänning som du kan använda för din utveckling:

  • Enkel igenkänning

    • En bildigenkänning lyssnar efter en paus i ljudet och slutar sedan att känna igen, och bearbetar bara högst 15 sekunders ljud.

    • Den här typen av erkännande fungerar bra för de korta pm som företagets medicinska klienter tillhandahåller, men det fungerar inte under de längre dikteringarna.

    • Enkel igenkänning är enklare att implementera i ditt program, men du har mindre kontroll.

  • Kontinuerlig igenkänning

    • Kontinuerlig igenkänning fortsätter att lyssna tills igenkänningen har stoppats.

    • Den här typen av igenkänning fungerar bra för både korta pm och längre dikteringar.

    • Kontinuerlig igenkänning kräver mer kod att implementera i ditt program, men du har mer kontroll.

I nästa övning använder du enkel igenkänning för att skapa ett program som du kan använda för att transkribera de korta pm:erna från företagets medicinska klienter. Senare i den här modulen använder du kontinuerlig igenkänning för att skapa ett program som du kan använda för att transkribera både korta pm och längre dikteringar.

Skapa ett program med enkel igenkänning för att transkribera ljudfiler

Om du vill skapa ett program som konverterar tal till text med enkel igenkänning med Azure AI Speech måste programmet utföra alla följande uppgifter:

  • Microsoft.CognitiveServices.Speech Inkludera paketet.

  • Skapa en SpeechConfig klass med hjälp av API-nyckeln från ditt Azure AI-tjänstkonto.

  • Skapa en AudioConfig klass med en WAVE-fil som källa.

  • Skapa en SpeechRecognizer klass med klasserna SpeechConfig och AudioConfig .

  • RecognizeOnceAsync() Anropa -metoden för SpeechRecognizer klassen för att konvertera talet till text.

  • Skapa en StreamWriter klass för att skriva den konverterade texten till en fil.

I nästa övning ska vi titta närmare på alla dessa steg.