Introdução
Suponha que você seja um desenvolvedor que trabalha para uma empresa de transcrição médica. Os clientes da sua empresa são uma equipa de médicos que gravam as suas notas como ficheiros áudio em gravadores de voz digitais portáteis. Eles compartilham seus arquivos com sua empresa por meio de uma unidade de nuvem compartilhada, e suas anotações são uma combinação de memorandos breves e ditados mais longos.
Sua empresa tem que manter uma grande equipe de transcritores, e esses dois tipos de arquivos de áudio apresentam desafios interessantes para sua empresa:
Os transcritores da sua empresa requerem muito tempo para processar o volume de memorandos breves dos seus clientes, por isso é difícil para a sua empresa devolver as transcrições dentro do prazo definido no contrato de nível de serviço (SLA) da sua empresa.
Os ditados mais longos muitas vezes não podem ser transcritos em uma única sessão, e os transcritores da sua empresa têm dificuldade em se lembrar de onde pararam durante a sessão anterior.
Você já ouviu falar que os serviços de IA do Azure da Microsoft fornecem APIs aos desenvolvedores para criar aplicativos que aproveitam os recursos de fala para texto da IA do Azure, e seu gerente pediu que você pesquisasse como você pode usar os recursos de fala para texto para criar um aplicativo que você pode usar para compensar algumas das tarefas de transcrição, aliviando assim alguns de seus custos operacionais e problemas de contrato de nível de serviço.
Neste módulo, você aprenderá a usar os serviços de IA do Azure para criar um aplicativo de fala em texto que converte um arquivo WAVE de exemplo em texto.