Sdílet prostřednictvím


Shromažďování uživatelských vstupů

Díky vydání akce Rozpoznávání volání do služby Azure Communication Services můžou vývojáři vylepšit své aplikace IVR nebo kontaktního centra, aby rozpoznali uživatelský vstup. Jedním z nejběžnějších scénářů rozpoznávání je přehrání zprávy pro uživatele, který je vyzve k zadání odpovědi, která pak aplikace rozpozná, jakmile aplikaci rozpozná a pak provede odpovídající akci. Vstup od volajících lze přijímat několika způsoby, mezi které patří DTMF (vstup uživatele prostřednictvím číslic na volajícím zařízení), řeč nebo kombinace DTMF i řeči.

Rozpoznávání řeči na text

Integrace služeb Azure Communications se službami Azure AI umožňuje prostřednictvím akce Rozpoznávání analyzovat zvuk v reálném čase a přepisovat mluvené slovo do textu. Společnost Microsoft využívá univerzální jazykový model jako základní model, který je natrénovaný s daty vlastněnými Microsoftem a odráží běžně používaný mluvený jazyk. Tento model je předem natrénovaný pomocí dialektů a fonetik představujících různé společné domény. Další informace o podporovaných

DTMF

Rozpoznávání vícefrekvenčních tónů (DTMF) je proces pochopení tónů a zvuků vygenerovaných telefonem při stisknutí čísla. Zařízení na přijímajícím konci naslouchá konkrétnímu tónu a pak je převede na příkazy. Tyto příkazy obvykle signalizují záměr uživatele při navigaci v nabídce ve scénáři IVR nebo v některých případech lze použít k zachycení důležitých informací, které uživatel potřebuje poskytnout prostřednictvím klávesnice telefonu.

Události DTMF a jejich přidružené tóny

Událost Tón
0 Nula
0 Jeden
2 Dva
3 3
4 Čtyři
5 Pět
6 Šest
7 Sedm
8 Osm
9 Devět
A A
B T
C C
D D
* Hvězdička
# Bušit

Běžné případy použití

Akce rozpoznávání se dá použít z mnoha důvodů. Tady je několik příkladů, jak můžou vývojáři použít akci rozpoznávání ve své aplikaci.

Vylepšení cesty uživatelů pomocí samoobslužných výzev

  • Uživatelé můžou volat – povolením rozpoznávání vstupu povolíte volajícímu navigaci v nabídce IVR a poskytnutím informací, které je možné použít k vyřešení dotazu.
  • Shromážděte informace o uživateli – povolením rozpoznávání vstupu může aplikace shromáždit vstup od volajících. Může se jednat o informace, jako jsou čísla účtů, informace o platební kartě atd.
  • Odpověď volajícího na přepis – pomocí rozpoznávání hlasu můžete shromažďovat uživatelský vstup a přepisovat zvuk na text a analyzovat ho, aby prováděly konkrétní obchodní akce.

Přerušení zvukových výzev

Uživatel může opustit nabídku IVR a mluvit s lidskou agentkou – Když vaše aplikace přeruší přerušení DTMF, může uživatelům umožnit přerušit tok nabídky IVR a být schopni chatovat s lidským agentem.

Ukázková architektura pro shromažďování uživatelských vstupů v hovoru s rozpoznáváním hlasu

Diagram znázorňující ukázkovou architekturu pro rozpoznávání akce AI

Ukázková architektura pro shromažďování uživatelských vstupů ve volání

Rozpoznat akci

Známé omezení

  • Nástroj DTMF v pásmu není podporován, místo toho použijte RFC 2833 DTMF.
  • Výzvy k převodu textu na řeč podporují maximálně 400 znaků, pokud je výzva delší, než je tato možnost, doporučujeme použít SSML pro akce přehrávání založené na převodu textu na řeč.
  • V situacích, kdy překročíte limit kvóty služby Speech, můžete požádat o zvýšení tohoto limitu podle kroků uvedených zde.

Další kroky