O que é um assistente de voz?

Artigo
02/25/2025

Usando assistentes de voz com o serviço de fala, os desenvolvedores podem criar interfaces de conversação naturais, semelhantes a seres humanos para seus aplicativos e experiências. O serviço de assistente de voz fornece interação rápida e confiável entre um dispositivo e uma implementação de assistente.

Escolha uma solução de assistente

O primeiro passo para criar um assistente de voz é decidir o que você quer que ele faça. O serviço de fala fornece várias soluções complementares para a criação de interações com assistentes. Você pode querer que seu aplicativo suporte uma conversa aberta com frases como "Preciso ir a Seattle" ou "Que tipo de pizza posso pedir?"

Arquitetura de referência para criar um assistente de voz usando o SDK de fala

Diagrama conceitual do fluxo do serviço de orquestração do assistente de voz.

Principais características

Quer escolha uma palavra-chave personalizada ou outra solução para criar as interações do seu assistente, pode utilizar um conjunto avançado de funcionalidades de personalização para personalizar o seu assistente de acordo com a sua marca, produto e personalidade.

Categoria	Funcionalidades
Palavra-chave personalizada	Os usuários podem iniciar conversas com assistentes usando uma palavra-chave personalizada, como "Hey Contoso". Um aplicativo faz isso com um mecanismo de palavra-chave personalizado no SDK de fala, que você pode configurar indo para Introdução às palavras-chave personalizadas. Os assistentes de voz podem usar a verificação de palavras-chave do lado do serviço para melhorar a precisão da ativação da palavra-chave (em vez de usar apenas o dispositivo).
Conversão de fala em texto	Os assistentes de voz convertem áudio em tempo real em texto reconhecido usando fala em texto do serviço de fala. Este texto está disponível, tal como é transcrito, tanto para a implementação do assistente como para a aplicação cliente.
Conversão de texto em fala	As respostas textuais do seu assistente são sintetizadas através de conversão de texto em voz a partir do serviço de Voz. Esta síntese é então disponibilizada para o seu aplicativo cliente como um fluxo de áudio. A Microsoft oferece a capacidade de criar sua própria voz personalizada e de alta qualidade Neural Text to speech (Neural TTS) que dá voz à sua marca.

Código de exemplo e tutoriais

O código de exemplo para criar um assistente de voz está disponível no GitHub em Azure-Samples/Cognitive-Services-Voice-Assistant.

Personalização

Os assistentes de voz criados usando o serviço de Fala podem usar uma gama completa de opções de personalização.

Nota

As opções de personalização variam de acordo com o idioma e a localidade. Para saber mais, consulte Idiomas suportados.

Partilhar via

O que é um assistente de voz?

Escolha uma solução de assistente

Arquitetura de referência para criar um assistente de voz usando o SDK de fala

Principais características

Código de exemplo e tutoriais

Personalização

Comentários

Recursos adicionais

Partilhar via

O que é um assistente de voz?

Escolha uma solução de assistente

Arquitetura de referência para criar um assistente de voz usando o SDK de fala

Principais características

Código de exemplo e tutoriais

Personalização

Conteúdos relacionados

Comentários

Recursos adicionais