Introdução
Suponha que você seja um desenvolvedor que trabalha para uma empresa de transcrição médica. Os clientes da sua empresa são uma equipe de médicos que gravam anotações como arquivos de áudio em gravadores de voz digital portáteis. Eles compartilham os arquivos com sua empresa por meio de uma unidade de nuvem compartilhada, e as anotações deles são uma combinação de breves memorandos e ditados mais longos.
Sua empresa precisa manter uma grande equipe de transcritores e esses dois tipos de arquivos de áudio apresentam desafios interessantes para sua empresa:
Os transcritores de sua empresa precisam de muito tempo para processar o volume de memorandos breves de seus clientes, portanto, é difícil para sua empresa devolver as transcrições dentro do prazo definido no contrato de nível de serviço (SLA) de sua empresa.
Os ditados mais longos geralmente não podem ser transcritos em uma única sessão, e os transcritores da sua empresa têm dificuldade de lembrar onde pararam na sessão anterior.
Você ouviu que os serviços de IA do Azure da Microsoft fornecem APIs aos desenvolvedores para criar aplicativos que aproveitam os recursos de conversão de fala em texto da IA do Azure, e seu gerente pediu que você pesquisasse como usar os recursos de conversão de fala em texto para criar um aplicativo que possa ser usado para compensar algumas das tarefas de transcrição, aliviando assim alguns de seus custos operacionais e problemas de contrato de nível de serviço.
Neste módulo, você aprenderá a usar os serviços de IA do Azure para criar um aplicativo de conversão de fala em texto que converte um arquivo WAVE de amostra em texto.