Compartilhar via


Cliente de Ingestão com serviços de IA do Azure

O Cliente de Ingestão é uma ferramenta lançada pela Microsoft no GitHub que ajuda a implantar rapidamente uma solução de transcrição de call center no Azure com uma abordagem sem código.

Dica

Você pode usar a ferramenta e a solução resultante na produção para processar um alto volume de áudios.

O Cliente de Ingestão usa a linguagem de IA do Azure, a Fala de IA do Azure, o armazenamento do Azure e o Azure Functions.

Introdução ao Cliente de Ingestão

Uma conta do Azure e um recurso de serviços de IA do Azure de vários serviços são necessários para executar o Cliente de Ingestão.

Recursos do Cliente de Ingestão

O Cliente de Ingestão funciona conectando uma conta dedicada do Armazenamento do Azure a Azure Functions personalizadas de modo sem servidor para transmitir solicitações de transcrição ao serviço. Os arquivos de áudio transcritos vão para o contêiner do Armazenamento do Azure dedicado.

Importante

O preço varia de acordo com o modo de operação (lote x tempo real), bem como com a função SKU do Azure selecionada. Por padrão, a ferramenta criará um SKU de função do Azure Premium para lidar com grandes volumes. Veja a página de preço para saber mais.

Internamente, a ferramenta usa os serviços Fala e Linguagem e segue as práticas recomendadas para lidar com expansão, repetição e failover. O esquema a seguir descreve os recursos e as conexões.

Diagrama que mostra a arquitetura do Cliente de Ingestão.

O seguinte recurso do serviço Fala é usado pela Ingestão de Cliente:

  • Conversão de fala em texto em lote: Transcreva grandes quantidades de arquivos de áudio de maneira assíncrona, incluindo a diarização do locutor – função normalmente usada em cenários de análise pós-chamada. A diarização é o processo de reconhecer e separar locutores em dados de áudio de canal mono.

Aqui estão alguns recursos do serviço de linguagem que são usados pela Ingestão de Cliente:

Além dos serviços de IA do Azure, esses produtos do Azure são usados para concluir a solução:

  • Armazenamento do Azure: usado para armazenar dados de telefonia e as transcrições retornadas pela API de transcrição em lote. Essa conta de armazenamento deve usar notificações, especificamente para quando novos arquivos são adicionados. Essas notificações são usadas para disparar o processo de transcrição.
  • Azure Functions: usado para criar o URI de SAS (assinatura de acesso compartilhado) para cada gravação e acionar a solicitação HTTP POST para iniciar uma transcrição. Além disso, use o Azure Functions para criar solicitações a fim de recuperar e excluir transcrições usando a API de Transcrição em Lote.

Personalização da ferramenta

A ferramenta é criada para mostrar rapidamente os resultados dos clientes. Você pode personalizá-la para seus SKUs e suas configurações preferenciais. Os SKUs podem ser editados no portal do Azure e o código está disponível no GitHub.

Observação

Sugerimos criar os recursos no mesmo grupo de recursos dedicado para entender e controlar os custos com mais facilidade.

Próximas etapas