Coletar entradas do usuário

Artigo
03/15/2024

Com a versão da ação Reconhecimento de Automação de Chamadas dos Serviços de Comunicação do Azure, os desenvolvedores agora podem aprimorar os próprios aplicativos IVR ou de centro de contato para reconhecer a entrada do usuário. Um dos cenários mais comuns de reconhecimento é reproduzir uma mensagem para o usuário, o que solicita que ele forneça uma resposta que, em seguida, é reconhecida pelo aplicativo, que depois realiza uma ação correspondente. A entrada dos chamadores pode ser recebida de várias maneiras, que incluem DTMF (entrada do usuário por meio dos dígitos no dispositivo de chamada dele), fala ou uma combinação de DTMF e fala.

Reconhecimento de voz com conversão de fala em texto

A integração dos serviços de Comunicação do Azure com os serviços de IA do Azure permite que você, por meio da ação Reconhecer, analise o áudio em tempo real para transcrever a palavra falada em texto. A Microsoft utiliza um Modelo de Linguagem Universal pronto para uso como um modelo base treinado com os dados de propriedade da Microsoft e reflete a linguagem falada comumente usada. Esse modelo é pré-treinado com dialetos e fonética que representam vários domínios comuns. Para obter mais informações sobre idiomas compatíveis, consulte Idiomas e voz com suporte para o serviço de Fala.

DTMF

O reconhecimento de DTMF (multifrequência de tom duplo) é o processo de compreensão de tons/sons gerados por um telefone, quando um número é pressionado. O equipamento na extremidade de recebimento escuta o tom específico e o converte em comandos. Esses comandos geralmente sinalizam a intenção do usuário ao navegar em um menu em um cenário de IVR ou, em alguns casos, podem ser usados para capturar informações importantes que o usuário precisa fornecer por meio do teclado de telefone.

Eventos de DTMF e os tons associados

Evento	Tom
0	Zero
1	Um
2	Dois
3	Três
4	Quatro
5	Cinco
6	Seis
7	Sete
8	Oito
9	Nove
A	A
B	B
C	C
D	D
*	Asterisco
#	Libra

Casos de uso comuns

A ação de reconhecimento pode ser usada por muitos motivos. Veja aqui alguns exemplos de como os desenvolvedores podem usar a ação de reconhecimento no aplicativo.

Melhorar o percurso do usuário com prompts de autoatendimento

Os usuários podem controlar a chamada – Ao habilitar o reconhecimento de entrada, você permite que o chamador navegue no menu de IVR e forneça informações que possam ser usadas para resolver a consulta.
Coletar informações do usuário – Ao habilitar o reconhecimento de entrada, o aplicativo pode coletar entradas dos chamadores. Isso pode incluir informações como números de conta, informações de cartão de crédito etc.
Transcrever a resposta do chamador – Com o reconhecimento de voz, você pode coletar a entrada do usuário, transcrever o áudio no texto e analisá-lo para executar uma ação comercial específica.

Interromper prompts de áudio

O usuário pode sair de um menu de IVR e falar com um agente humano – com a interrupção do DTMF, o aplicativo pode permitir que os usuários interrompam o fluxo do menu de IVR e conversem com um agente humano.

Arquitetura de exemplo para reunir entradas de usuário em uma chamada com o reconhecimento de voz

Arquitetura de exemplo para reunir entradas de usuário em uma chamada

Ação de reconhecimento

Limitações conhecidas

Não há suporte para DTMF em banda, use RFC 2833 DTMF.
Os prompts de texto de Conversão de Texto em Fala dão suporte a no máximo 400 caracteres. Se o prompt for maior do que isso, sugerimos o uso de SSML para ações de reprodução baseadas em Conversão de Texto em Fala.
Para cenários em que você excede o limite de cota do serviço de Fala, é possível solicitar o aumento desse limite seguindo as etapas descritas aqui.

Próximas etapas

Confira nosso guia de instruções para saber como você pode reunir entradas de usuário.
Saiba mais sobre o uso e os logs operacionais publicados pela automação de chamadas.

Compartilhar via