Přehrávání zvuku v hovoru
Akce přehrávání poskytovaná prostřednictvím sady SDK pro automatizaci volání ve službě Azure Communication Services umožňuje přehrávat zvukové výzvy účastníkům hovoru. K této akci je možné přistupovat prostřednictvím implementace vaší aplikace na straně serveru. Zvuk můžete přehrát a zavolat účastníkům jedním ze dvou způsobů;
- Poskytování přístupu služby Azure Communication Services k předem zaznamenaným zvukovým souborům ve formátu WAV, ke kterým má služba Azure Communication Services přístup s podporou ověřování
- Běžný text, který je možné převést na výstup řeči prostřednictvím integrace se službami Azure AI.
Nově oznámenou integraci mezi Službami Azure Communication Services a službami Azure AI můžete použít k přehrávání přizpůsobených odpovědí s využitím převodu textu na řeč v Azure. Můžete použít lidské, jako jsou předem připravené neurální hlasy, nebo můžete vytvářet vlastní neurální hlasy, které jsou jedinečné pro váš produkt nebo značku. Další informace o podporovaných hlasech, jazycích a národních prostředích najdete v tématu Podpora jazyka a hlasu pro službu Speech.
Poznámka:
Služba Azure Communication Services v současné době podporuje dva formáty souborů, soubory MP3 s ID3V2TAG a soubory WAV formátované jako 16bitový zvuk monokanály PCM nahrané na 16 KHz. Vlastní zvukové soubory můžete vytvářet pomocí syntézy řeči pomocí nástroje Pro vytváření zvukového obsahu.
Předem sestavený neurální text na řečové hlasy
Microsoft používá hluboké neurální sítě k překonání limitů tradiční syntézy řeči s ohledem na stres a intonaci v mluveném jazyce. Prosody predikce a syntéza hlasu se vyskytují současně, což vede k více tekutinám a přirozenému zvuku výstupu. Tyto neurální hlasy můžete použít k tomu, aby byly interakce s chatovacími roboty a hlasovými asistenty přirozenější a poutavější. Existuje více než 100 předem připravených hlasů, ze které si můžete vybrat. Přečtěte si další informace o hlasech azure převodu textu na řeč.
Běžné případy použití
Akce přehrávání se dá použít mnoha způsoby. Tady jsou uvedeny některé příklady toho, jak můžou vývojáři chtít akci přehrávání použít ve svých aplikacích.
Oznámení
Vaše aplikace může chtít přehrát nějaké oznámení, když se účastník připojí nebo opustí hovor, a upozornit ostatní uživatele.
Samoobslužní zákazníci
Ve scénářích se službami IVRs a virtuálními asistenty můžete pomocí aplikace nebo robotů přehrávat hlasové výzvy volajícím. Tato výzva může být ve formě nabídky, která volajícího provede jejich interakcí.
Přidržte hudbu
Akce přehrávání se dá použít také k přehrávání hudby pro volající. Tuto akci je možné nastavit ve smyčce, aby se hudba pořád přehrála, dokud není agent k dispozici, aby volajícímu pomohl.
Přehrávání zpráv dodržování předpisů
V rámci požadavků na dodržování předpisů v různých odvětvích se od dodavatelů očekává, že volajícím přehrají zprávy týkající se právních předpisů nebo dodržování předpisů, například "Tento hovor je zaznamenán pro účely kvality".
Ukázková architektura přehrávání zvuku při volání pomocí převodu textu na řeč
Ukázková architektura pro přehrávání zvuku v hovoru
Známá omezení
- Výzvy k převodu textu na řeč podporují maximálně 400 znaků, pokud je výzva delší, než je tato možnost, doporučujeme použít SSML pro akce přehrávání založené na převodu textu na řeč.
- V situacích, kdy překročíte limit kvóty služby Speech, můžete požádat o zvýšení tohoto limitu podle kroků uvedených zde.
Další kroky
- Podívejte se na naši příručku s návody k přehrávání vlastních hlasových výzev uživatelům.
- Přečtěte si o využití a provozních protokolech publikovaných automatizací volání.
- Přečtěte si informace o shromažďování zákaznických vstupů.