Cliente de Ingestão com serviços de IA do Azure
O Cliente de Ingestão é uma ferramenta lançada pela Microsoft no GitHub que ajuda a implantar rapidamente uma solução de transcrição de call center no Azure com uma abordagem sem código.
Dica
Você pode usar a ferramenta e a solução resultante na produção para processar um alto volume de áudios.
O Cliente de Ingestão usa a linguagem de IA do Azure, a Fala de IA do Azure, o armazenamento do Azure e o Azure Functions.
Introdução ao Cliente de Ingestão
Uma conta do Azure e um recurso de serviços de IA do Azure de vários serviços são necessários para executar o Cliente de Ingestão.
- Assinatura do Azure – Criar uma gratuitamente
- Criar um recurso de serviços de IA do Azure no portal do Azure.
- Obtenha a região e a chave de recurso. Depois que o recurso for implantado, selecione Ir para o recurso para exibir e gerenciar as chaves. Para obter mais informações sobre os recursos dos serviços de IA do Azure, consulte este início rápido.
Recursos do Cliente de Ingestão
O Cliente de Ingestão funciona conectando uma conta dedicada do Armazenamento do Azure a Azure Functions personalizadas de modo sem servidor para transmitir solicitações de transcrição ao serviço. Os arquivos de áudio transcritos vão para o contêiner do Armazenamento do Azure dedicado.
Importante
O preço varia de acordo com o modo de operação (lote x tempo real), bem como com a função SKU do Azure selecionada. Por padrão, a ferramenta criará um SKU de função do Azure Premium para lidar com grandes volumes. Veja a página de preço para saber mais.
Internamente, a ferramenta usa os serviços Fala e Linguagem e segue as práticas recomendadas para lidar com expansão, repetição e failover. O esquema a seguir descreve os recursos e as conexões.
O seguinte recurso do serviço Fala é usado pela Ingestão de Cliente:
- Conversão de fala em texto em lote: Transcreva grandes quantidades de arquivos de áudio de maneira assíncrona, incluindo a diarização do locutor – função normalmente usada em cenários de análise pós-chamada. A diarização é o processo de reconhecer e separar locutores em dados de áudio de canal mono.
Aqui estão alguns recursos do serviço de linguagem que são usados pela Ingestão de Cliente:
- Extração e redação de PII (informações de identificação pessoal): identifique, categorize e redija informações confidenciais na transcrição de conversas.
- Análise de sentimento e mineração de opiniões: analise transcrições e associe sentimentos positivos, neutros ou negativos no nível da conversa e do enunciado.
Além dos serviços de IA do Azure, esses produtos do Azure são usados para concluir a solução:
- Armazenamento do Azure: usado para armazenar dados de telefonia e as transcrições retornadas pela API de transcrição em lote. Essa conta de armazenamento deve usar notificações, especificamente para quando novos arquivos são adicionados. Essas notificações são usadas para disparar o processo de transcrição.
- Azure Functions: usado para criar o URI de SAS (assinatura de acesso compartilhado) para cada gravação e acionar a solicitação HTTP POST para iniciar uma transcrição. Além disso, use o Azure Functions para criar solicitações a fim de recuperar e excluir transcrições usando a API de Transcrição em Lote.
Personalização da ferramenta
A ferramenta é criada para mostrar rapidamente os resultados dos clientes. Você pode personalizá-la para seus SKUs e suas configurações preferenciais. Os SKUs podem ser editados no portal do Azure e o código está disponível no GitHub.
Observação
Sugerimos criar os recursos no mesmo grupo de recursos dedicado para entender e controlar os custos com mais facilidade.