收集使用者輸入

發行項
11/09/2024

隨著 Azure 通訊服務通話自動化辨識動作的發行，開發人員現在可以增強其 IVR 或連絡中心應用程式，以辨識使用者輸入。其中一個最常見的辨識案例是向使用者播放訊息，提示使用者提供回應，然後由應用程式辨識，一經辨識，應用程式就會執行對應的動作。可以透過數種方式接收來自呼叫者的輸入，包括 DTMF (透過通話裝置上數字的使用者輸入)、語音或 DTMF 和語音的組合。

使用語音轉換文字進行語音辨識

Azure 通訊服務與 Azure AI 服務整合，可讓您透過「辨識」動作即時分析音訊，以將說出口的話轉譯成文字。開箱即用的 Microsoft 運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型，且能夠反映常用的口語語言。此模型會預先定型，其中包含代表各種常見網域的方言和注音符號。如需支援語言的詳細資訊，請參閱語音服務的語言和語音支援。

DTMF

複頻式訊號 (DTMF) 辨識是指按下數字時，理解電話所產生的音調/音效的過程。然後，接收端接聽特定音調的設備會將音效轉換為命令。這些命令通常指出在 IVR 案例中瀏覽功能表時的使用者意圖，或在某些情況下，可用來擷取使用者必須透過手機按鍵提供的重要資訊。

DTMF 事件及其相關聯的音調

Event	語氣
0	零
1	一個
2	兩個
3	三
4	四
5	五
6	六個
7	Seven
8	八個
9	九
A	A
B	B
C	C
D	D
*	星號
#	Pound

常見使用案例

使用辨識動作有諸多原因，以下是開發人員如何在其應用程式中使用辨識動作的幾個範例。

使用自助提示改善使用者旅程圖

使用者可以控制通話 - 藉由啟用輸入辨識，您可以讓來電者瀏覽 IVR 功能表，並提供可用來解析其查詢的資訊。
收集使用者資訊 - 藉由啟用輸入辨識，您的應用程式可以從來電者收集輸入。這可以是帳戶號碼、信用卡資訊等資訊。
轉譯呼叫者回應 - 使用語音辨識，您可以收集使用者輸入並將音訊轉譯為文字，並加以分析以執行特定的商務動作。

中斷音訊提示

使用者可以離開 IVR 功能表，並與專員說話 - 透過 DTMF 中斷，您的應用程式可讓使用者中斷 IVR 功能表的流程，並能夠與專員聊天。

在具有語音辨識的通話中收集使用者輸入的範例結構

在通話中收集使用者輸入的架構範例

辨識動作

已知的限制

不支援頻內 DTMF，請改用 RFC 2833 DTMF。
文字轉換語音的文字提示最多支援 400 個字元，如果您的提示超出此長度，建議對文字轉換語音型播放動作使用 SSML。
針對超過語音服務配額限制的案例，您可以遵循此處所述的步驟來要求提高此限制。

下一步

請參閱我們的操作指南，以了解如何收集使用者輸入。
了解通話自動化發佈的使用量和作業記錄。

共用方式為