Tworzenie ciągłej rozpoznawania mowy w aplikacji tekstowej

5 min

W poprzednim ćwiczeniu pokazano, jak utworzyć aplikację, która używała rozpoznawania pojedynczego strzału do transkrypcji krótkich plików audio. Ta aplikacja dobrze sprawdzała się w przypadku krótkich notatek audio dostarczonych przez klientów medycznych, ale twoja firma potrzebuje aplikacji, której można użyć do transkrypcji dłuższych plików dyktowania klientów.

Mając to na uwadze, w następnym ćwiczeniu zmodyfikujesz istniejącą aplikację tak, aby korzystała z ciągłego rozpoznawania, która działa zarówno dla krótkich notatek, jak i dłuższych dyktowania. Ciągłe rozpoznawanie zapewnia większą kontrolę nad procesem rozpoznawania mowy, ale wymaga więcej kodu do zaimplementowania w aplikacji.

Tworzenie aplikacji przy użyciu ciągłego rozpoznawania w celu transkrypcji plików audio

Aby utworzyć aplikację, która przekonwertuje mowę na tekst przy użyciu ciągłego rozpoznawania mowy w usłudze Azure AI, aplikacja będzie musiała wykonać wszystkie następujące zadania:

Uwzględnij Microsoft.CognitiveServices.Speech pakiet.
Utwórz klasę SpeechConfig przy użyciu klucza interfejsu API na koncie usług Azure AI.
Utwórz klasę AudioConfig przy użyciu pliku WAVE jako źródła.
Utwórz klasę SpeechRecognizer przy użyciu SpeechConfig klas i AudioConfig .
Zasubskrybuj następujące zdarzenia SpeechRecognizer klasy:
- Zdarzenie Recognized wykrywa, czy tekst został rozpoznany.
- Zdarzenie Canceled wykrywa, czy rozpoznawanie zostało anulowane, co może być spowodowane błędem.
- Zdarzenie SessionStopped wykrywa, kiedy rozpoznawanie zostało zatrzymane.
Utwórz klasę, StreamWriter aby zapisać przekonwertowany tekst do pliku.
Wywołaj metodę StartContinuousRecognitionAsync() SpeechRecognizer klasy , aby rozpocząć rozpoznawanie, oraz metodę zatrzymania rozpoznawania StopContinuousRecognitionAsync() .

W następnym ćwiczeniu przyjrzymy się szczegółowo wszystkim tym krokom.

Tworzenie ciągłej rozpoznawania mowy w aplikacji tekstowej

Tworzenie aplikacji przy użyciu ciągłego rozpoznawania w celu transkrypcji plików audio

Opinia