Shromažďování uživatelských vstupů
Díky vydání akce Rozpoznávání volání do služby Azure Communication Services můžou vývojáři vylepšit své aplikace IVR nebo kontaktního centra, aby rozpoznali uživatelský vstup. Jedním z nejběžnějších scénářů rozpoznávání je přehrání zprávy pro uživatele, který je vyzve k zadání odpovědi, která pak aplikace rozpozná, jakmile aplikaci rozpozná a pak provede odpovídající akci. Vstup od volajících lze přijímat několika způsoby, mezi které patří DTMF (vstup uživatele prostřednictvím číslic na volajícím zařízení), řeč nebo kombinace DTMF i řeči.
Rozpoznávání řeči na text
Integrace služeb Azure Communications se službami Azure AI umožňuje prostřednictvím akce Rozpoznávání analyzovat zvuk v reálném čase a přepisovat mluvené slovo do textu. Společnost Microsoft využívá univerzální jazykový model jako základní model, který je natrénovaný s daty vlastněnými Microsoftem a odráží běžně používaný mluvený jazyk. Tento model je předem natrénovaný pomocí dialektů a fonetik představujících různé společné domény. Další informace o podporovaných
DTMF
Rozpoznávání vícefrekvenčních tónů (DTMF) je proces pochopení tónů a zvuků vygenerovaných telefonem při stisknutí čísla. Zařízení na přijímajícím konci naslouchá konkrétnímu tónu a pak je převede na příkazy. Tyto příkazy obvykle signalizují záměr uživatele při navigaci v nabídce ve scénáři IVR nebo v některých případech lze použít k zachycení důležitých informací, které uživatel potřebuje poskytnout prostřednictvím klávesnice telefonu.
Události DTMF a jejich přidružené tóny
Událost | Tón |
---|---|
0 | Nula |
0 | Jeden |
2 | Dva |
3 | 3 |
4 | Čtyři |
5 | Pět |
6 | Šest |
7 | Sedm |
8 | Osm |
9 | Devět |
A | A |
B | T |
C | C |
D | D |
* | Hvězdička |
# | Bušit |
Běžné případy použití
Akce rozpoznávání se dá použít z mnoha důvodů. Tady je několik příkladů, jak můžou vývojáři použít akci rozpoznávání ve své aplikaci.
Vylepšení cesty uživatelů pomocí samoobslužných výzev
- Uživatelé můžou volat – povolením rozpoznávání vstupu povolíte volajícímu navigaci v nabídce IVR a poskytnutím informací, které je možné použít k vyřešení dotazu.
- Shromážděte informace o uživateli – povolením rozpoznávání vstupu může aplikace shromáždit vstup od volajících. Může se jednat o informace, jako jsou čísla účtů, informace o platební kartě atd.
- Odpověď volajícího na přepis – pomocí rozpoznávání hlasu můžete shromažďovat uživatelský vstup a přepisovat zvuk na text a analyzovat ho, aby prováděly konkrétní obchodní akce.
Přerušení zvukových výzev
Uživatel může opustit nabídku IVR a mluvit s lidskou agentkou – Když vaše aplikace přeruší přerušení DTMF, může uživatelům umožnit přerušit tok nabídky IVR a být schopni chatovat s lidským agentem.
Ukázková architektura pro shromažďování uživatelských vstupů v hovoru s rozpoznáváním hlasu
Ukázková architektura pro shromažďování uživatelských vstupů ve volání
Známé omezení
- Nástroj DTMF v pásmu není podporován, místo toho použijte RFC 2833 DTMF.
- Výzvy k převodu textu na řeč podporují maximálně 400 znaků, pokud je výzva delší, než je tato možnost, doporučujeme použít SSML pro akce přehrávání založené na převodu textu na řeč.
- V situacích, kdy překročíte limit kvóty služby Speech, můžete požádat o zvýšení tohoto limitu podle kroků uvedených zde.
Další kroky
- Podívejte se na naši příručku s postupy, kde se dozvíte, jak můžete shromažďovat vstupy uživatelů.
- Přečtěte si o využití a provozních protokolech publikovaných automatizací volání.