Přehrávání zvuku v hovoru

Článek
02/28/2024

Akce přehrávání poskytovaná prostřednictvím sady SDK pro automatizaci volání ve službě Azure Communication Services umožňuje přehrávat zvukové výzvy účastníkům hovoru. K této akci je možné přistupovat prostřednictvím implementace vaší aplikace na straně serveru. Zvuk můžete přehrát a zavolat účastníkům jedním ze dvou způsobů;

Poskytování přístupu služby Azure Communication Services k předem zaznamenaným zvukovým souborům ve formátu WAV, ke kterým má služba Azure Communication Services přístup s podporou ověřování
Běžný text, který je možné převést na výstup řeči prostřednictvím integrace se službami Azure AI.

Nově oznámenou integraci mezi Službami Azure Communication Services a službami Azure AI můžete použít k přehrávání přizpůsobených odpovědí s využitím převodu textu na řeč v Azure. Můžete použít lidské, jako jsou předem připravené neurální hlasy, nebo můžete vytvářet vlastní neurální hlasy, které jsou jedinečné pro váš produkt nebo značku. Další informace o podporovaných hlasech, jazycích a národních prostředích najdete v tématu Podpora jazyka a hlasu pro službu Speech.

Poznámka:

Služba Azure Communication Services v současné době podporuje dva formáty souborů, soubory MP3 s ID3V2TAG a soubory WAV formátované jako 16bitový zvuk monokanály PCM nahrané na 16 KHz. Vlastní zvukové soubory můžete vytvářet pomocí syntézy řeči pomocí nástroje Pro vytváření zvukového obsahu.

Předem sestavený neurální text na řečové hlasy

Microsoft používá hluboké neurální sítě k překonání limitů tradiční syntézy řeči s ohledem na stres a intonaci v mluveném jazyce. Prosody predikce a syntéza hlasu se vyskytují současně, což vede k více tekutinám a přirozenému zvuku výstupu. Tyto neurální hlasy můžete použít k tomu, aby byly interakce s chatovacími roboty a hlasovými asistenty přirozenější a poutavější. Existuje více než 100 předem připravených hlasů, ze které si můžete vybrat. Přečtěte si další informace o hlasech azure převodu textu na řeč.

Běžné případy použití

Akce přehrávání se dá použít mnoha způsoby. Tady jsou uvedeny některé příklady toho, jak můžou vývojáři chtít akci přehrávání použít ve svých aplikacích.

Oznámení

Vaše aplikace může chtít přehrát nějaké oznámení, když se účastník připojí nebo opustí hovor, a upozornit ostatní uživatele.

Samoobslužní zákazníci

Ve scénářích se službami IVRs a virtuálními asistenty můžete pomocí aplikace nebo robotů přehrávat hlasové výzvy volajícím. Tato výzva může být ve formě nabídky, která volajícího provede jejich interakcí.

Přidržte hudbu

Akce přehrávání se dá použít také k přehrávání hudby pro volající. Tuto akci je možné nastavit ve smyčce, aby se hudba pořád přehrála, dokud není agent k dispozici, aby volajícímu pomohl.

Přehrávání zpráv dodržování předpisů

V rámci požadavků na dodržování předpisů v různých odvětvích se od dodavatelů očekává, že volajícím přehrají zprávy týkající se právních předpisů nebo dodržování předpisů, například "Tento hovor je zaznamenán pro účely kvality".

Ukázková architektura přehrávání zvuku při volání pomocí převodu textu na řeč

Diagram znázorňující ukázkovou architekturu play with AI

Ukázková architektura pro přehrávání zvuku v hovoru

Snímek obrazovky s tokem pro akci přehrávání

Známá omezení

Výzvy k převodu textu na řeč podporují maximálně 400 znaků, pokud je výzva delší, než je tato možnost, doporučujeme použít SSML pro akce přehrávání založené na převodu textu na řeč.
V situacích, kdy překročíte limit kvóty služby Speech, můžete požádat o zvýšení tohoto limitu podle kroků uvedených zde.

Další kroky

Podívejte se na naši příručku s návody k přehrávání vlastních hlasových výzev uživatelům.
Přečtěte si o využití a provozních protokolech publikovaných automatizací volání.
Přečtěte si informace o shromažďování zákaznických vstupů.

Sdílet prostřednictvím