Tłumaczenie mowy na tekst
Wzorzec tłumaczenia mowy przy użyciu zestawu AZURE AI Speech SDK jest podobny do rozpoznawania mowy, a dodanie informacji o językach źródłowych i docelowych do tłumaczenia:
Użyj obiektu SpeechTranslationConfig, aby hermetyzować informacje wymagane do nawiązania połączenia z zasobem usługi Mowa usługi Azure AI. W szczególności jego lokalizacja i klucz.
Obiekt SpeechTranslationConfig służy również do określania języka rozpoznawania mowy (języka, w którym mowa wejściowa jest mówiona) i języków docelowych, w których ma zostać przetłumaczony.
Opcjonalnie użyj pliku AudioConfig , aby zdefiniować źródło wejściowe dla dźwięku do transkrypcji. Domyślnie jest to domyślny mikrofon systemowy, ale można również określić plik dźwiękowy.
Użyj obiektu SpeechTranslationConfig i AudioConfig , aby utworzyć obiekt TranslationRecognizer . Ten obiekt jest klientem proxy interfejsu API tłumaczenia mowy usługi Azure AI.
Użyj metod obiektu TranslationRecognizer , aby wywołać podstawowe funkcje interfejsu API. Na przykład metoda RecognizeOnceAsync() używa usługi Azure AI Speech do asynchronicznego tłumaczenia pojedynczej wypowiedzi mówionej.
Przetwarzanie odpowiedzi z usługi Azure AI Speech. W przypadku metody RecognizeOnceAsync() wynik jest obiektem SpeechRecognitionResult zawierającym następujące właściwości:
- Czas trwania
- OffsetInTicks
- Właściwości
- Przyczyna
- ResultId
- Text
- Tłumaczenia
Jeśli operacja zakończyła się pomyślnie, właściwość Reason ma wyliczoną wartość RecognizedSpeech, właściwość Text zawiera transkrypcję w oryginalnym języku. Możesz również uzyskać dostęp do właściwości Translations , która zawiera słownik tłumaczeń (przy użyciu dwuznakowego kodu języka ISO, takiego jak "en" dla języka angielskiego, jako klucza).