Coletar entradas do usuário
Com a versão da ação Reconhecimento de Automação de Chamadas dos Serviços de Comunicação do Azure, os desenvolvedores agora podem aprimorar os próprios aplicativos IVR ou de centro de contato para reconhecer a entrada do usuário. Um dos cenários mais comuns de reconhecimento é reproduzir uma mensagem para o usuário, o que solicita que ele forneça uma resposta que, em seguida, é reconhecida pelo aplicativo, que depois realiza uma ação correspondente. A entrada dos chamadores pode ser recebida de várias maneiras, que incluem DTMF (entrada do usuário por meio dos dígitos no dispositivo de chamada dele), fala ou uma combinação de DTMF e fala.
Reconhecimento de voz com conversão de fala em texto
A integração dos serviços de Comunicação do Azure com os serviços de IA do Azure permite que você, por meio da ação Reconhecer, analise o áudio em tempo real para transcrever a palavra falada em texto. A Microsoft utiliza um Modelo de Linguagem Universal pronto para uso como um modelo base treinado com os dados de propriedade da Microsoft e reflete a linguagem falada comumente usada. Esse modelo é pré-treinado com dialetos e fonética que representam vários domínios comuns. Para obter mais informações sobre idiomas compatíveis, consulte Idiomas e voz com suporte para o serviço de Fala.
DTMF
O reconhecimento de DTMF (multifrequência de tom duplo) é o processo de compreensão de tons/sons gerados por um telefone, quando um número é pressionado. O equipamento na extremidade de recebimento escuta o tom específico e o converte em comandos. Esses comandos geralmente sinalizam a intenção do usuário ao navegar em um menu em um cenário de IVR ou, em alguns casos, podem ser usados para capturar informações importantes que o usuário precisa fornecer por meio do teclado de telefone.
Eventos de DTMF e os tons associados
Evento | Tom |
---|---|
0 | Zero |
1 | Um |
2 | Dois |
3 | Três |
4 | Quatro |
5 | Cinco |
6 | Seis |
7 | Sete |
8 | Oito |
9 | Nove |
A | A |
B | B |
C | C |
D | D |
* | Asterisco |
# | Libra |
Casos de uso comuns
A ação de reconhecimento pode ser usada por muitos motivos. Veja aqui alguns exemplos de como os desenvolvedores podem usar a ação de reconhecimento no aplicativo.
Melhorar o percurso do usuário com prompts de autoatendimento
- Os usuários podem controlar a chamada – Ao habilitar o reconhecimento de entrada, você permite que o chamador navegue no menu de IVR e forneça informações que possam ser usadas para resolver a consulta.
- Coletar informações do usuário – Ao habilitar o reconhecimento de entrada, o aplicativo pode coletar entradas dos chamadores. Isso pode incluir informações como números de conta, informações de cartão de crédito etc.
- Transcrever a resposta do chamador – Com o reconhecimento de voz, você pode coletar a entrada do usuário, transcrever o áudio no texto e analisá-lo para executar uma ação comercial específica.
Interromper prompts de áudio
O usuário pode sair de um menu de IVR e falar com um agente humano – com a interrupção do DTMF, o aplicativo pode permitir que os usuários interrompam o fluxo do menu de IVR e conversem com um agente humano.
Arquitetura de exemplo para reunir entradas de usuário em uma chamada com o reconhecimento de voz
Arquitetura de exemplo para reunir entradas de usuário em uma chamada
Limitações conhecidas
- Não há suporte para DTMF em banda, use RFC 2833 DTMF.
- Os prompts de texto de Conversão de Texto em Fala dão suporte a no máximo 400 caracteres. Se o prompt for maior do que isso, sugerimos o uso de SSML para ações de reprodução baseadas em Conversão de Texto em Fala.
- Para cenários em que você excede o limite de cota do serviço de Fala, é possível solicitar o aumento desse limite seguindo as etapas descritas aqui.
Próximas etapas
- Confira nosso guia de instruções para saber como você pode reunir entradas de usuário.
- Saiba mais sobre o uso e os logs operacionais publicados pela automação de chamadas.