Criar um aplicativo de reconhecimento de fala para texto de captura única

5 minutos

No exercício anterior, você aprendeu como criar uma conta de serviços de IA do Azure usando a CLI do Azure. Agora que você tem uma conta de serviços de IA do Azure com a qual trabalhar, pode começar a trabalhar em seu aplicativo de fala para texto.

Seu primeiro desafio é criar um aplicativo que sua empresa possa usar para transcrever os breves memorandos de seus clientes médicos. Os serviços de IA do Azure fornecem dois tipos diferentes de reconhecimento de fala que você pode usar para seu desenvolvimento:

Reconhecimento de tiro único
- O reconhecimento de captura única ouve uma pausa no áudio e, em seguida, para de reconhecer, processando apenas um máximo de 15 segundos de áudio.
- Este tipo de reconhecimento funcionará bem para os breves memorandos que os clientes médicos da sua empresa fornecem, mas não funcionará para os ditames mais longos.
- O reconhecimento de captura única é mais fácil de implementar em seu aplicativo, mas você tem menos controle.
Reconhecimento contínuo
- O reconhecimento contínuo continuará a ouvir até que o reconhecimento seja interrompido.
- Este tipo de reconhecimento funcionará bem tanto para os memorandos breves como para ditados mais longos.
- O reconhecimento contínuo requer mais código para implementar em seu aplicativo, mas você tem mais controle.

No próximo exercício, você usará o reconhecimento de tiro único para criar um aplicativo que poderá ser usado para transcrever os breves memorandos dos clientes médicos da sua empresa. Mais adiante neste módulo, você usará o reconhecimento contínuo para criar um aplicativo que poderá ser usado para transcrever memorandos breves e ditados mais longos.

Criando um aplicativo usando reconhecimento de captura única para transcrever arquivos de áudio

Para criar um aplicativo que converterá fala em texto usando o reconhecimento de captura única do Azure AI Speech, seu aplicativo terá que realizar todas as seguintes tarefas:

Inclua o Microsoft.CognitiveServices.Speech pacote.
Crie uma SpeechConfig classe usando a chave de API da sua conta de serviços de IA do Azure.
Crie uma AudioConfig classe usando um arquivo WAVE como origem.
Crie uma SpeechRecognizer classe usando as SpeechConfig classes and AudioConfig .
Invoque o RecognizeOnceAsync() SpeechRecognizer método da classe para converter a fala em texto.
Crie uma StreamWriter classe para gravar o texto convertido em um arquivo.

No próximo exercício, veremos todas essas etapas em detalhes.

Criar um aplicativo de reconhecimento de fala para texto de captura única

Criando um aplicativo usando reconhecimento de captura única para transcrever arquivos de áudio

Comentários