建立單次辨識語音轉換文字應用程式。

已完成

在上一個練習中,您已了解如何使用 Azure CLI 建立 Azure AI 服務帳戶。 現在您已擁有可運作的 Azure AI 服務帳戶,您可以開始進行語音轉換文字應用程式。

您的第一項挑戰是建立一個應用程式,讓您的公司用來轉譯醫療客戶的簡短備忘稿。 Azure AI 服務提供兩種不同類型的語音辨識,供您用於開發:

  • 單次辨識

    • 單次辨識會聆聽音訊中的中斷,然後停止辨識,而且只會處理最多 15 秒的音訊。

    • 這種類型的辨識對於您公司醫療用戶提供的簡短備忘稿非常適合,但不適用於較長的聽寫。

    • 單次辨識更容易在應用程式中實作,但您的控制性較小。

  • 連續辨識

    • 連續辨識會繼續聆聽,直到停止辨識為止。

    • 這種類型的辨識適用於簡短備忘稿和較長的聽寫。

    • 連續辨識需要更多程式碼才能在應用程式中實作,但您有更多控制權。

在下一個練習中,您將使用單次辨識來建立應用程式,讓您用來轉譯公司醫療客戶的簡短備忘稿。 稍後在本課程模組中,您將使用連續辨識來建立應用程式,以用來轉譯簡短備忘稿和較長的聽寫。

使用單次辨識建立應用程式以轉譯音訊檔案

若要建立使用 Azure AI 語音將語音轉換成文字的應用程式,您的應用程式必須完成下列所有工作:

  • 包含 Microsoft.CognitiveServices.Speech 套件。

  • 使用來自 Azure AI 服務帳戶的 API 金鑰建立 SpeechConfig 類別。

  • 使用 WAVE 檔案作為來源建立 AudioConfig 類別。

  • 使用 SpeechConfigAudioConfig 類別建立 SpeechRecognizer 類別。

  • 叫用 SpeechRecognizer 類別的 RecognizeOnceAsync() 方法,轉換為語音轉換文字。

  • 建立 StreamWriter 類別以將轉換的文字寫入檔案。

在下一個練習中,我們將詳細查看所有步驟。