Tworzenie ciągłej rozpoznawania mowy w aplikacji tekstowej
W poprzednim ćwiczeniu pokazano, jak utworzyć aplikację, która używała rozpoznawania pojedynczego strzału do transkrypcji krótkich plików audio. Ta aplikacja dobrze sprawdzała się w przypadku krótkich notatek audio dostarczonych przez klientów medycznych, ale twoja firma potrzebuje aplikacji, której można użyć do transkrypcji dłuższych plików dyktowania klientów.
Mając to na uwadze, w następnym ćwiczeniu zmodyfikujesz istniejącą aplikację tak, aby korzystała z ciągłego rozpoznawania, która działa zarówno dla krótkich notatek, jak i dłuższych dyktowania. Ciągłe rozpoznawanie zapewnia większą kontrolę nad procesem rozpoznawania mowy, ale wymaga więcej kodu do zaimplementowania w aplikacji.
Tworzenie aplikacji przy użyciu ciągłego rozpoznawania w celu transkrypcji plików audio
Aby utworzyć aplikację, która przekonwertuje mowę na tekst przy użyciu ciągłego rozpoznawania mowy w usłudze Azure AI, aplikacja będzie musiała wykonać wszystkie następujące zadania:
Uwzględnij
Microsoft.CognitiveServices.Speech
pakiet.Utwórz klasę
SpeechConfig
przy użyciu klucza interfejsu API na koncie usług Azure AI.Utwórz klasę
AudioConfig
przy użyciu pliku WAVE jako źródła.Utwórz klasę
SpeechRecognizer
przy użyciuSpeechConfig
klas iAudioConfig
.Zasubskrybuj następujące zdarzenia
SpeechRecognizer
klasy:- Zdarzenie
Recognized
wykrywa, czy tekst został rozpoznany. - Zdarzenie
Canceled
wykrywa, czy rozpoznawanie zostało anulowane, co może być spowodowane błędem. - Zdarzenie
SessionStopped
wykrywa, kiedy rozpoznawanie zostało zatrzymane.
- Zdarzenie
Utwórz klasę,
StreamWriter
aby zapisać przekonwertowany tekst do pliku.Wywołaj metodę
StartContinuousRecognitionAsync()
SpeechRecognizer
klasy , aby rozpocząć rozpoznawanie, oraz metodę zatrzymania rozpoznawaniaStopContinuousRecognitionAsync()
.
W następnym ćwiczeniu przyjrzymy się szczegółowo wszystkim tym krokom.