Introdução

2 minutos

O Fala de IA do Azure fornece APIs que você pode utilizar para criar aplicativos habilitados para fala. Isso inclui:

Conversão de fala em texto: uma API que habilita o reconhecimento de fala no qual seu aplicativo pode aceitar uma entrada falada.
Conversão de texto em fala: uma API que habilita a sintetização de voz em que o aplicativo pode fornecer a saída de fala.
Tradução de Fala: uma API que você pode usar para traduzir a entrada falada para vários idiomas.
Reconhecimento do Locutor: uma API que permite que o aplicativo reconheça cada falante com base na voz.
Reconhecimento de intenção: uma API que utiliza a compreensão da linguagem coloquial para determinar o significado semântico da entrada falada.

Este módulo se concentra no reconhecimento de fala e na sintetização de voz, que são as principais funcionalidades de qualquer aplicativo habilitado para fala.

Neste módulo, você aprenderá a:

Provisionar um recurso do Azure para o serviço de Fala de IA do Azure
Usar a API de Conversão de fala em texto para implementar o reconhecimento de fala
Usar a API de Conversão de texto em fala para implementar a sintetização de voz
Configurar o formato de áudio e as vozes
Usar a SSML (Linguagem de Marcação de Sintetização de Voz)

As unidades do módulo incluem importantes informações conceituais sobre o Fala de IA do Azure e como utilizar sua API por meio de um dos SDKs (Software Development Kits) com suporte, após o que você poderá experimentar o Fala de IA do Azure em um exercício prático. Para concluir o exercício prático, você precisará de uma assinatura do Microsoft Azure. Caso ainda não tenha uma, inscreva-se em uma avaliação gratuita em https://azure.com/free.

Introdução

Comentários