什麼是 Speech Studio？

發行項
03/10/2025

Speech Studio 是一組 UI 型工具，可在您的應用程式中建置及整合 Azure AI 語音服務的功能。您可以透過無程式碼方法在 Speech Studio 中建立專案，然後使用 Speech SDK、Speech CLI 或 REST API 參考您在應用程式中的資產。

提示

您也可以在 Azure AI Foundry 入口網站中嘗試語音轉換文字和文字到語音轉換，而不需註冊或撰寫任何程式碼。

Speech Studio 案例

探索、試用及檢視一些常見使用案例的範例程式碼。

字幕：選擇範例影片剪輯以查看即時或離線處理的字幕結果。了解如何同步處理字幕與輸入音訊、套用粗話篩選、取得部分結果、套用自訂項目，以及識別多語情節的口語語言。如需詳細資訊，請參閱字幕快速入門。
客服中心：檢視示範，了解如何使用語言和語音服務來分析客服中心交談。即時轉譯通話或批次處理通話、修訂個人識別資訊，以及擷取情感等深入解析，協助您的客服中心使用案例。如需詳細資訊，請參閱客服中心快速入門。

如需在 Speech Studio 中這些案例的示範，請檢視此簡介影片。

Speech Studio 功能

在 Speech Studio 中，下列語音服務功能會以專案類型的形式來提供：

即時語音轉換文字：在不必使用任何程式碼的情況下，將音訊檔案拖曳至此，即可快速測試語音轉換文字。 Speech Studio 是示範工具，目的是讓您了解語音轉換文字對音訊範例的運作情況。若要探索完整的功能，請參閱什麼是語音轉換文字。
批次語音轉換文字：快速測試批次謄寫功能以在儲存體中謄寫大量音訊，並以非同步方式接收結果，若要深入了解批次語音轉換文字，請參閱批次語音轉換文字概觀。
自訂語音：建立針對特定詞彙集和說話方式量身打造的語音辨識模型。相較於基本的語音辨識模型，自訂語音模型因為不得公開存取，所以會是您獨一無二競爭優勢的一環。若要開始上傳範例音訊以建立自訂語音模型，請參閱上傳定型和測試資料集。
發音評估會評估語音發音，並向說話者提供關於說話音訊正確度和流暢度的意見反應。 Speech Studio 提供了沙箱供您快速測試此功能，而不需要程式碼。若要在應用程式中搭配語音 SDK 來使用此功能，請參閱發音評估一文。
語音翻譯：以低延遲快速測試語音，並將語音翻譯成您選擇的其他語言。若要探索完整的功能，請參閱什麼是語音翻譯。
語音資源庫：建置可自然說話的應用程式和服務。從廣泛的語言、語音和變體組合中選擇。使用真情實感的擬人化合成語音，讓您的案例更加生動。
自訂語音：建立文字轉換語音的獨一無二自訂語音。您可以在 Speech Studio 中提供音訊檔案並建立相符的轉譯，然後在應用程式中使用自訂的語音。若要透過端點建立和使用自訂語音，請參閱建立和使用您的語音模型。
音訊內容建立：文字轉換語音合成的無程式碼方法。您可以依原樣使用輸出音訊，或做為進一步自訂的起點。您可以針對各種案例 (例如有聲書、新聞廣播、影片旁白和聊天機器人)，建立高度自然的音訊內容。如需詳細資訊，請參閱音訊內容建立文件。
自訂關鍵字：自訂關鍵字是一個字組或短句，可讓您透過語音來啟動產品。您可以在 Speech Studio 中建立自訂關鍵字，然後產生二進位檔案，在您的應用程式中搭配 Speech SDK 使用。

下一步

探索 Speech Studio

共用方式為

什麼是 Speech Studio？

Speech Studio 案例

Speech Studio 功能

下一步

意見反應

其他資源