Introdução
O Fala de IA do Azure fornece APIs que você pode utilizar para criar aplicativos habilitados para fala. Isso inclui:
- Conversão de fala em texto: uma API que habilita o reconhecimento de fala no qual seu aplicativo pode aceitar uma entrada falada.
- Conversão de texto em fala: uma API que habilita a sintetização de voz em que o aplicativo pode fornecer a saída de fala.
- Tradução de Fala: uma API que você pode usar para traduzir a entrada falada para vários idiomas.
- Reconhecimento do Locutor: uma API que permite que o aplicativo reconheça cada falante com base na voz.
- Reconhecimento de intenção: uma API que utiliza a compreensão da linguagem coloquial para determinar o significado semântico da entrada falada.
Este módulo se concentra no reconhecimento de fala e na sintetização de voz, que são as principais funcionalidades de qualquer aplicativo habilitado para fala.
Neste módulo, você aprenderá a:
- Provisionar um recurso do Azure para o serviço de Fala de IA do Azure
- Usar a API de Conversão de fala em texto para implementar o reconhecimento de fala
- Usar a API de Conversão de texto em fala para implementar a sintetização de voz
- Configurar o formato de áudio e as vozes
- Usar a SSML (Linguagem de Marcação de Sintetização de Voz)
As unidades do módulo incluem importantes informações conceituais sobre o Fala de IA do Azure e como utilizar sua API por meio de um dos SDKs (Software Development Kits) com suporte, após o que você poderá experimentar o Fala de IA do Azure em um exercício prático. Para concluir o exercício prático, você precisará de uma assinatura do Microsoft Azure. Caso ainda não tenha uma, inscreva-se em uma avaliação gratuita em https://azure.com/free.