Tworzenie ciągłej rozpoznawania mowy w aplikacji tekstowej

Ukończone

W poprzednim ćwiczeniu pokazano, jak utworzyć aplikację, która używała rozpoznawania pojedynczego strzału do transkrypcji krótkich plików audio. Ta aplikacja dobrze sprawdzała się w przypadku krótkich notatek audio dostarczonych przez klientów medycznych, ale twoja firma potrzebuje aplikacji, której można użyć do transkrypcji dłuższych plików dyktowania klientów.

Mając to na uwadze, w następnym ćwiczeniu zmodyfikujesz istniejącą aplikację tak, aby korzystała z ciągłego rozpoznawania, która działa zarówno dla krótkich notatek, jak i dłuższych dyktowania. Ciągłe rozpoznawanie zapewnia większą kontrolę nad procesem rozpoznawania mowy, ale wymaga więcej kodu do zaimplementowania w aplikacji.

Tworzenie aplikacji przy użyciu ciągłego rozpoznawania w celu transkrypcji plików audio

Aby utworzyć aplikację, która przekonwertuje mowę na tekst przy użyciu ciągłego rozpoznawania mowy w usłudze Azure AI, aplikacja będzie musiała wykonać wszystkie następujące zadania:

  • Uwzględnij Microsoft.CognitiveServices.Speech pakiet.

  • Utwórz klasę SpeechConfig przy użyciu klucza interfejsu API na koncie usług Azure AI.

  • Utwórz klasę AudioConfig przy użyciu pliku WAVE jako źródła.

  • Utwórz klasę SpeechRecognizer przy użyciu SpeechConfig klas i AudioConfig .

  • Zasubskrybuj następujące zdarzenia SpeechRecognizer klasy:

    • Zdarzenie Recognized wykrywa, czy tekst został rozpoznany.
    • Zdarzenie Canceled wykrywa, czy rozpoznawanie zostało anulowane, co może być spowodowane błędem.
    • Zdarzenie SessionStopped wykrywa, kiedy rozpoznawanie zostało zatrzymane.
  • Utwórz klasę, StreamWriter aby zapisać przekonwertowany tekst do pliku.

  • Wywołaj metodę StartContinuousRecognitionAsync() SpeechRecognizer klasy , aby rozpocząć rozpoznawanie, oraz metodę zatrzymania rozpoznawania StopContinuousRecognitionAsync() .

W następnym ćwiczeniu przyjrzymy się szczegółowo wszystkim tym krokom.