將語音翻譯成文字
使用 Azure AI 語音 SDK 進行語音翻譯的模式類似於語音辨識,其中包含用於轉譯之來源和目的語言的相關資訊:
使用 SpeechConfig 物件,封裝連線至您的 Azure AI 語音資源所需的資訊。 具體而言,是它的位置和金鑰。
SpeechTranslationConfig 物件也被用來指定語音辨識 (說話輸入語音) 的語言,以及應轉譯的目的語言。
(選擇性) 使用 AudioConfig 來定義要轉譯的音訊的輸入來源。 根據預設,這是預設的系統麥克風,但您也可以指定音訊檔案。
使用 SpeechTranslationConfig 和 AudioConfig 建立 TranslationRecognizer 物件。 此物件是 Azure AI 語音翻譯 API 的 proxy 用戶端。
使用 TranslationRecognizer 物件的方法來呼叫基礎 API 函數。 例如,RecognizeOnceAsync() 方法會使用 Azure AI 語音服務,以非同步方式翻譯單一口說語句。
處理來自 Azure AI 語音的回應。 在使用 RecognizeOnceAsync() 方法的情況下,結果會是 SpeechRecognitionResult 物件,其包含下列屬性:
- 期間
- OffsetInTicks
- 屬性
- 原因
- ResultId
- Text
- 翻譯
如果作業成功,Reason 屬性會有列舉值 RecognizedSpeech,且 Text 屬性會包含原來語言的謄寫。 您也可以存取包含翻譯字典 (使用雙字元 ISO 語言代碼,例如英文的 "en" 作為索引鍵) 的 Translations 屬性。