Shromažďování uživatelských vstupů

Článek
03/08/2024

Díky vydání akce Rozpoznávání volání do služby Azure Communication Services můžou vývojáři vylepšit své aplikace IVR nebo kontaktního centra, aby rozpoznali uživatelský vstup. Jedním z nejběžnějších scénářů rozpoznávání je přehrání zprávy pro uživatele, který je vyzve k zadání odpovědi, která pak aplikace rozpozná, jakmile aplikaci rozpozná a pak provede odpovídající akci. Vstup od volajících lze přijímat několika způsoby, mezi které patří DTMF (vstup uživatele prostřednictvím číslic na volajícím zařízení), řeč nebo kombinace DTMF i řeči.

Rozpoznávání řeči na text

Integrace služeb Azure Communications se službami Azure AI umožňuje prostřednictvím akce Rozpoznávání analyzovat zvuk v reálném čase a přepisovat mluvené slovo do textu. Společnost Microsoft využívá univerzální jazykový model jako základní model, který je natrénovaný s daty vlastněnými Microsoftem a odráží běžně používaný mluvený jazyk. Tento model je předem natrénovaný pomocí dialektů a fonetik představujících různé společné domény. Další informace o podporovaných

DTMF

Rozpoznávání vícefrekvenčních tónů (DTMF) je proces pochopení tónů a zvuků vygenerovaných telefonem při stisknutí čísla. Zařízení na přijímajícím konci naslouchá konkrétnímu tónu a pak je převede na příkazy. Tyto příkazy obvykle signalizují záměr uživatele při navigaci v nabídce ve scénáři IVR nebo v některých případech lze použít k zachycení důležitých informací, které uživatel potřebuje poskytnout prostřednictvím klávesnice telefonu.

Události DTMF a jejich přidružené tóny

Událost	Tón
0	Nula
0	Jeden
2	Dva
3	3
4	Čtyři
5	Pět
6	Šest
7	Sedm
8	Osm
9	Devět
A	A
B	T
C	C
D	D
*	Hvězdička
#	Bušit

Běžné případy použití

Akce rozpoznávání se dá použít z mnoha důvodů. Tady je několik příkladů, jak můžou vývojáři použít akci rozpoznávání ve své aplikaci.

Vylepšení cesty uživatelů pomocí samoobslužných výzev

Uživatelé můžou volat – povolením rozpoznávání vstupu povolíte volajícímu navigaci v nabídce IVR a poskytnutím informací, které je možné použít k vyřešení dotazu.
Shromážděte informace o uživateli – povolením rozpoznávání vstupu může aplikace shromáždit vstup od volajících. Může se jednat o informace, jako jsou čísla účtů, informace o platební kartě atd.
Odpověď volajícího na přepis – pomocí rozpoznávání hlasu můžete shromažďovat uživatelský vstup a přepisovat zvuk na text a analyzovat ho, aby prováděly konkrétní obchodní akce.

Přerušení zvukových výzev

Uživatel může opustit nabídku IVR a mluvit s lidskou agentkou – Když vaše aplikace přeruší přerušení DTMF, může uživatelům umožnit přerušit tok nabídky IVR a být schopni chatovat s lidským agentem.

Ukázková architektura pro shromažďování uživatelských vstupů v hovoru s rozpoznáváním hlasu

Ukázková architektura pro shromažďování uživatelských vstupů ve volání

Rozpoznat akci

Známé omezení

Nástroj DTMF v pásmu není podporován, místo toho použijte RFC 2833 DTMF.
Výzvy k převodu textu na řeč podporují maximálně 400 znaků, pokud je výzva delší, než je tato možnost, doporučujeme použít SSML pro akce přehrávání založené na převodu textu na řeč.
V situacích, kdy překročíte limit kvóty služby Speech, můžete požádat o zvýšení tohoto limitu podle kroků uvedených zde.

Další kroky

Podívejte se na naši příručku s postupy, kde se dozvíte, jak můžete shromažďovat vstupy uživatelů.
Přečtěte si o využití a provozních protokolech publikovaných automatizací volání.

Sdílet prostřednictvím