什麼是語音翻譯?
在本文中,您將了解使用 Azure AI 語音進行翻譯的優點和功能。 此語音服務支援音訊串流的即時多語言語音轉換語音及語音轉換文字翻譯。
您可以使用語音 SDK 或語音 CLI,將所提供音訊的來源謄寫和翻譯輸出存取權授予您的應用程式、工具和裝置。 偵測到語音時,系統會傳回過渡謄寫和翻譯結果,而最終結果可以轉換為合成語音。
如需語音翻譯的支援語言清單,請參閱語言和語音支援。
提示
移至 Speech Studio,以低延遲快速測試語音,並將語音翻譯成您選擇的其他語言。
核心功能
語音翻譯的核心功能包括:
語音轉換文字翻譯
語音服務所提供的標準功能是能夠採用您指定來源語言的輸入音訊串流,並將其翻譯及輸出為指定目標語言的文字。
語音轉換語音翻譯
作為上述功能的補充,語音服務也提供使用預先定型語音的大型資料庫大聲朗讀翻譯文字的選項,讓輸入語音可以自然輸出。
多語言語音翻譯
多語言語音翻譯實現了新層級的語音翻譯技術,可發揮各種功能,包括沒有指定的輸入語言、處理相同工作階段中的語言切換,以及支援將即時串流翻譯轉換成英文。 這些功能可實現新一層級的語音翻譯功能,您可將這些功能導入產品。
- 沒有指定的輸入語言。 多語言語音翻譯可以接收各種語言的音訊,而且不需要指定預期的輸入語言。
- 語言切換。 多語言語音翻譯允許在相同的工作階段期間說出多種語言,並將它們全部翻譯成相同的目標語言。 輸入語言變更或您執行任何其他操作時,不需要重新啟動工作階段。
- 謄寫。 此服務會以指定的目標語言輸出謄寫。 尚未提供來源語言謄寫。
多語言語音翻譯的一些使用案例包括:
- 旅遊解譯器。 出國旅行時,多語言語音翻譯可供建立解決方案,讓客戶能夠將任何輸入音訊翻譯成當地語言,或從當地語言進行翻譯。 這可讓客戶與當地人溝通,並更加了解周遭環境。
- 商務會議。 在與不同語言的人開會時,多語言語音翻譯可以讓會議成員彼此自然地溝通,就像沒有語言障礙一樣。
如需支援的輸入(來源)語言清單,請參閱 語音轉換文字語言檔。 如需支援的輸出(目標)語言清單,請參閱語音翻譯語言檔中的翻譯文字語言表格。
如需有關多語言語音翻譯的詳細資訊,請參閱語音翻譯操作指南以及 GitHub 上的語音翻譯範例 (英文)。
多目標語言翻譯
在您想要以多種語言輸出的情況下,語音服務會直接提供將輸入語言翻譯成兩種目標語言的能力。 這可讓它們接收兩個輸出,並透過單一 API 呼叫,將這些翻譯分享給更廣泛的對象。 如果需要更多的輸出語言,您可以建立多服務資源或使用個別的翻譯服務。
如果您需要翻譯成兩種以上的目標語言,您必須建立 Azure AI 服務資源,或利用個別的翻譯服務,以取得第二種語言以外的更多語言。 如果您選擇使用多服務資源呼叫語音翻譯服務,請注意,翻譯費用會根據翻譯的字元數,套用到第二種語言以外的每種語言。
若要計算套用的翻譯費用,請參閱 Azure AI 翻譯工具定價。
多目標語言翻譯定價
請務必注意,語音翻譯服務是即時運作的,中繼語音結果會經過翻譯產生中繼翻譯結果。 因此,實際翻譯數量會大於輸入音訊的語彙基元。 您需支付每種目標語言的語音轉換文字謄寫與文字翻譯費用。
例如,假設您想要將一小時的音訊檔案翻譯成三種目標語言的文字。 如果初始語音轉換文字謄寫包含 10,000 個字元,您可能需支付 2.80 美元的費用。
警告
此範例中的價格僅供說明之用。 如需最新的定價資訊,請參閱 Azure AI 語音定價和 Azure AI 翻譯工具定價。
上述範例價格為 2.80 美元,其計算方式是合併語音轉換文字謄寫和文字翻譯的成本。 計算方式如下:
- 語音翻譯定價為每小時 2.50 美元,最多涵蓋 2 種目標語言。 此價格是用來當作計算成本的範例。 如需最新的定價資訊,請參閱 Azure AI 語音定價表中隨用隨付 > 語音翻譯標準>。
- 本範例中第三種語言的翻譯成本為 30 美分。 翻譯定價為每百萬個字元 10 美元。 由於音訊檔案包含 10,000 個字元,翻譯成本為 10 美元 * 10,000 / 1,000,000 * 3 = 0.3 美元。 此方程式中的數字「3」代表中繼流量的加權係數,可能會因牽涉到的語言而有所不同。 此價格是用來當作計算成本的範例。 如需最新的定價資訊,請參閱 Azure AI 語音定價表中的隨用隨付 > 標準翻譯 > 文字翻譯。
開始使用
您的第一步是嘗試語音翻譯快速入門。 語音翻譯服務可透過語音 SDK 和語音 CLI 取得。
您可以在 GitHub 上找到 語音 SDK 語音轉換文字和翻譯範例。 這些範例包含常見案例,例如從檔案或串流讀取音訊、連續辨識及翻譯、一次性辨識及翻譯,以及使用自訂模型。