Criar um aplicativo de conversão de fala em texto com reconhecimento de disparo único

5 minutos

No exercício anterior, você aprendeu como criar uma conta dos serviços de IA do Azure usando a CLI do Azure. Agora que você tem uma conta dos serviços de IA do Azure, pode começar a trabalhar com o aplicativo de conversão de fala em texto.

Seu primeiro desafio é criar um aplicativo que sua empresa possa usar para transcrever os breves memorandos dos clientes médicos. Os serviços de IA do Azure fornecem dois tipos diferentes de reconhecimento de fala que podem ser usados para o desenvolvimento:

Reconhecimento pontual
- O reconhecimento de disparo único detecta uma pausa no áudio e, em seguida, para de ser realizado, processando apenas 15 segundos de áudio no máximo.
- Esse tipo de reconhecimento funciona bem para os breves memorandos que os clientes médicos da sua empresa fornecem, mas não funcionará para falas mais longas.
- O reconhecimento de disparo único é mais fácil de implementar no aplicativo, mas você tem menos controle.
Reconhecimento contínuo
- O reconhecimento contínuo continua escutando até que o reconhecimento seja interrompido.
- Esse tipo de reconhecimento funciona bem para memorandos breves e falas mais longas.
- Para implementar o reconhecimento contínuo no aplicativo, é preciso trabalhar com mais códigos, mas você tem mais controle.

No exercício a seguir, você usará o reconhecimento de disparo único a fim de criar um aplicativo que possa ser usado para transcrever os breves memorandos dos clientes médicos da sua empresa. Posteriormente neste módulo, você usará o reconhecimento contínuo para criar um aplicativo que possa usar para transcrever memorandos breves e falas mais longas.

Criar um aplicativo usando o reconhecimento de disparo único para transcrever arquivos de áudio

Para criar um aplicativo que converta fala em texto usando o reconhecimento de disparo único da Fala de IA do Azure, o aplicativo deve executar todas as seguintes tarefas:

Incluir o pacote Microsoft.CognitiveServices.Speech.
Crie uma classe SpeechConfig utilizando a chave de API da sua conta de serviços de IA do Azure.
Criar uma classe AudioConfig usando um arquivo WAVE como a origem.
Criar uma classe SpeechRecognizer usando as classes SpeechConfig e AudioConfig.
Invocar o método RecognizeOnceAsync() da classe SpeechRecognizer para converter a fala em texto.
Crie uma classe StreamWriter para gravar o texto convertido em um arquivo.

No próximo exercício, todas essas etapas serão abordadas em detalhes.

Criar um aplicativo de conversão de fala em texto com reconhecimento de disparo único

Criar um aplicativo usando o reconhecimento de disparo único para transcrever arquivos de áudio

Comentários