Lite de voz neural personalizada (visualização)
O Azure AI Speech fornece dois tipos de projeto de voz neural (CNV) personalizados: CNV lite e CNV professional.
- O profissional de voz neural personalizada (CNV) permite que você carregue seus dados de treinamento coletados através de estúdios de gravação profissionais e crie uma voz de alta qualidade que é quase indistinguível de suas amostras humanas. O acesso profissional CNV é limitado com base em critérios de elegibilidade e uso. Solicite acesso no formulário de admissão.
- Custom neural voice (CNV) lite é um tipo de projeto em visualização pública. Você pode demonstrar e avaliar a voz neural personalizada antes de investir em gravações profissionais para criar uma voz de maior qualidade. Nenhuma aplicação é necessária para fins de demonstração e avaliação. No entanto, a Microsoft restringe e seleciona as amostras de gravação e teste para uso com CNV lite. Você deve solicitar acesso total ao CNV professional para implantar e usar o modelo CNV lite para fins comerciais. Nesse caso, solicite o acesso no formulário de admissão.
Com um projeto CNV lite, você grava sua voz on-line lendo de 20 a 50 scripts predefinidos fornecidos pela Microsoft. Depois de gravar pelo menos 20 amostras, você pode começar a treinar um modelo. Depois que o modelo for treinado com sucesso, você poderá revisá-lo e verificar 20 amostras de saída produzidas com outro conjunto de scripts predefinidos.
Consulte os idiomas suportados para voz neural personalizada.
Comparar tipos de projeto
A tabela a seguir resume as principais diferenças entre os tipos de projeto CNV lite e CNV professional.
Rubricas | Lite (Pré-visualização) | Pró |
---|---|---|
Cenários-alvo | Demonstração ou avaliação | Cenários profissionais, como vozes de marcas e personagens para chatbots ou leitura de conteúdo de áudio. |
Dados de preparação | Gravar online usando o Speech Studio | Traga os seus próprios dados. Recomenda-se gravar em estúdio profissional. |
Scripts para gravação | Fornecido no Speech Studio | Use seus próprios scripts que correspondam ao cenário de caso de uso. A Microsoft fornece scripts de exemplo para referência. |
Tamanho de dados necessário | 20-50 expressões | 300-2000 declarações |
Tempo de preparação | Menos de uma hora de computação | Aproximadamente 20-40 horas de computação |
Qualidade de voz | Qualidade moderada | Qualidade elevada |
Disponibilidade | Qualquer pessoa pode gravar amostras on-line e treinar um modelo para fins de demonstração e avaliação. O acesso total à voz neural personalizada é necessário se você quiser implantar o modelo CNV lite para uso comercial. | O carregamento de dados não é restrito, mas você só pode treinar e implantar um modelo profissional CNV depois que o acesso for aprovado. O acesso profissional CNV é limitado com base em critérios de elegibilidade e uso. Solicite acesso no formulário de admissão. |
Preços | Os preços unitários aplicam-se igualmente para os projetos profissionais CNV lite e CNV. Confira os detalhes de preços aqui. | Os preços unitários aplicam-se igualmente para os projetos profissionais CNV lite e CNV. Confira os detalhes de preços aqui. |
Criar um projeto de voz neural lite personalizado
Para criar um projeto personalizado de voz neural lite, siga estas etapas:
Inicie sessão no Speech Studio.
Selecione a assinatura e o recurso de fala com os quais trabalhar.
Selecione Voz>personalizada Criar um projeto.
Selecione Custom neural voice lite>Next. Para criar um projeto profissional de voz neural personalizado, consulte Criar um projeto para voz neural personalizada.
Siga as instruções fornecidas pelo assistente para criar seu projeto.
Importante
O projeto CNV lite expira após 90 dias, a menos que a declaração verbal gravada pelo talento de voz seja enviada.
Selecione o novo projeto pelo nome ou selecione Ir para o projeto. Você vê estes itens de menu no painel esquerdo: Gravar e compilar, Revisar modelo e Implantar modelo.
Grave e construa um modelo CNV lite
Grave pelo menos 20 amostras de voz (até 50) com scripts fornecidos online. As amostras de voz gravadas aqui são usadas para criar uma versão sintética da sua voz.
Nota
Atualmente, o treinamento de voz neural personalizado está disponível apenas em algumas regiões. Consulte as notas de rodapé na tabela de regiões para obter mais informações.
Aqui estão algumas dicas para ajudá-lo a gravar suas amostras de voz:
- Use um bom microfone. Aumente a clareza de suas amostras usando um microfone de alta qualidade. Fale a cerca de 8 centímetros de distância do microfone para evitar ruídos na boca.
- Evite o ruído de fundo. Grave em uma sala silenciosa, sem ruído de fundo ou eco.
- Relaxe e fale naturalmente. Permita-se expressar emoções enquanto lê as frases.
- Gravar em uma tomada. Para manter um nível de energia consistente, registre todas as frases em uma sessão.
- Pronuncie cada palavra corretamente e fale com clareza.
Para gravar e construir um modelo CNV lite, siga estes passos:
- Selecione Voz> personalizada O nome >do seu projeto Gravar e construir.
- Selecione Introdução.
- Leia atentamente os termos de uso do Voice talent. Marque a caixa de seleção para reconhecer os termos de uso.
- Selecione Aceitar
- Pressione o ícone do microfone para iniciar a verificação de ruído. Esta verificação de ruído demora apenas alguns segundos e não precisa de falar durante a mesma.
- Se tiver sido detetado ruído, pode selecionar Verificar novamente para repetir a verificação de ruído. Se nenhum ruído foi detetado, você pode selecionar Concluído para prosseguir para a próxima etapa.
- Reveja as dicas de gravação e selecione Conseguiu. Para obter os melhores resultados, vá para uma área tranquila sem ruído de fundo antes de gravar suas amostras de voz.
- Pressione o ícone do microfone para iniciar a gravação.
- Pressione o ícone de parada para parar a gravação.
- Analise as métricas de qualidade. Depois de gravar cada amostra, verifique sua métrica de qualidade antes de continuar para a próxima.
- Registre mais amostras. Embora você possa criar um modelo com apenas 20 amostras, é recomendável gravar até 50 para obter melhor qualidade.
- Selecione Modelo de trem para iniciar o processo de treinamento.
O processo de treinamento leva aproximadamente uma hora de computação. Você pode verificar o progresso do processo de treinamento na página Revisar modelo .
Modelo de revisão
Para rever o modelo CNV lite e ouvir a sua própria voz sintética, siga estes passos:
- Selecione Voz> personalizada Seu nome >de projeto Modelo de revisão. Aqui você pode revisar o nome do modelo de voz, o idioma do modelo, o tamanho dos dados de amostra e o progresso do treinamento. O nome da voz é composto pela palavra "Neural" anexada ao nome do seu projeto.
- Selecione o nome do modelo de voz para revisar os detalhes do modelo e ouvir o exemplo de texto para resultados de fala.
- Selecione o ícone de reprodução para ouvir a sua voz falar cada script.
Enviar declaração verbal
Uma declaração verbal gravada pelo talento de voz é necessária antes que você possa implantar o modelo para seu uso comercial.
Para enviar a declaração verbal de talento de voz, siga estas etapas:
- Selecione Voz> personalizada Seu nome> de projeto Implantar modelo>Gerencie seu talento de voz.
- Selecione o modelo.
- Insira o nome do talento de voz e o nome da empresa.
- Leia e grave a declaração. Selecione o ícone do microfone para iniciar a gravação. Selecione o ícone de parada para parar a gravação.
- Selecione Enviar para enviar a declaração.
- Verifique o status do processamento na tabela de scripts na parte inferior do painel. Quando o status for Bem-sucedido, você poderá implantar o modelo.
Implementar o modelo
Para implantar seu modelo de voz e usá-lo em seus aplicativos, você deve obter acesso total à voz neural personalizada. Solicite acesso no formulário de admissão. Dentro de aproximadamente 10 dias úteis, você recebe um e-mail com o status de aprovação. Uma declaração verbal gravada pelo talento de voz também é necessária antes que você possa implantar o modelo para uso comercial.
Para implantar um modelo CNV lite, siga estas etapas:
- Selecione Voz> personalizada Seu nome >de projeto Implantar modelo>Implantar modelo.
- Selecione um nome de modelo de voz e, em seguida, selecione Avançar.
- Introduza um nome e uma descrição para o seu ponto de extremidade e, em seguida, selecione Seguinte.
- Marque a caixa de seleção para concordar com os termos de uso e selecione Avançar.
- Selecione Implantar para implantar o modelo.
A partir daqui, você pode usar o modelo de voz CNV lite da mesma forma que você usaria um modelo de voz profissional CNV. Por exemplo, você pode suspender ou retomar um ponto de extremidade após sua criação, para limitar gastos e conservar recursos que não estão em uso. Você também pode acessar a voz na ferramenta de criação de conteúdo de áudio no Speech Studio.