Introdução

Concluído

Os recursos de fala de IA nos permitem gerenciar sistemas domésticos e automáticos com instruções de voz, obter respostas de computadores para perguntas faladas, gerar legendas de áudio e muito mais.

Para habilitar esse tipo de interação, o sistema de IA precisa ser compatível com pelo menos duas funcionalidades:

  • Reconhecimento de Fala: a capacidade de detectar e interpretar a entrada falada
  • Sintetização de voz: a capacidade de gerar uma saída falada

A Fala de IA do Azure fornece funcionalidades de conversão de fala em texto, conversão de texto em fala e tradução de fala por meio de reconhecimento de fala e síntese. Você pode usar modelos de serviço para Fala predefinidos e personalizados para diversas tarefas, desde transcrever áudio em texto com alta precisão, identificar alto-falantes em conversas, criar vozes personalizadas e muito mais. Em seguida, você aprenderá como funcionam os recursos de fala de IA.