Como gravar amostras de vídeo para avatar de texto para fala personalizado
Este artigo fornece instruções sobre como preparar exemplos de vídeo de alta qualidade para criar um avatar de texto para fala personalizado.
A construção de modelos personalizados de avatar de texto para fala requer treinamento em uma gravação de vídeo de um ser humano real falando. Esta pessoa é o talento avatar. Você deve obter consentimento suficiente sob todas as leis e regulamentos relevantes do talento do avatar para criar um avatar personalizado a partir da imagem ou semelhança do seu talento. Para saber mais sobre os requisitos do vídeo da declaração de consentimento, consulte Obter arquivo de consentimento do talento do avatar.
Ambiente de gravação
Recomendamos gravar em um estúdio de gravação de vídeo profissional ou em um lugar bem iluminado.
Requisito de antecedentes
Se você precisa de um avatar comercial com várias cenas, o fundo do vídeo deve ser limpo, suave, de cor pura, e uma tela verde é a melhor escolha.
Se o seu avatar só precisa ser usado em uma única cena, você pode selecionar uma cena específica para gravar (como no seu escritório), mas o plano de fundo não pode ser subtraído e alterado.
Aqui estão as práticas recomendadas a serem consideradas quando você usa um plano de fundo de cor pura (como tela verde) para gravação:
- Uma tela verde é colocada atrás de suas costas, e se o vídeo do seu avatar mostra o corpo completo do ator, incluindo os pés, deve haver uma tela verde sob os pés. E a tela verde traseira e a tela verde do chão devem estar perfeitamente conectadas.
- A tela verde deve ser plana e a cor é uniforme.
- O ator deve manter 0,5 m – 1 m de distância do fundo traseiro.
- A tela verde pode ser iluminada corretamente para evitar sombras.
- O contorno completo do ator está dentro da borda da tela verde.
- O ator não deve ficar muito perto da tela verde.
- Evite que a cabeça e as mãos do ator saiam da tela verde ao falar.
Requisitos de iluminação
- Garanta uma iluminação uniforme e brilhante no rosto do ator, evitando sombras no rosto ou reflexos nos óculos e roupas do ator.
- Tente evitar alterações na luz ambiente dos atores. Recomenda-se desligar o projetor, fechar as cortinas para evitar mudanças de luz do dia e usar uma fonte de luz artificial estável, etc.
Dispositivos
- Requisito da câmera: Um mínimo de resolução 1080-P e 25 FPS (quadros por segundo).
- Não altere a posição da luz e da câmera depois de se acomodar durante toda a gravação de vídeo.
- Você pode usar um teleprompter para lembrar o roteiro durante a gravação, mas garantir que ele não afete o olhar do ator para a câmera. Forneça um lugar para se sentar se o avatar precisar estar sentado.
- Para avatares digitais de meio comprimento ou sentados, forneça um lugar para se sentar para o ator. Se não quiser que a imagem da cadeira apareça, pode escolher uma cadeira.
Aparição do ator
O avatar personalizado de texto para fala não suporta personalização de roupas ou looks. Portanto, é essencial projetar e preparar cuidadosamente a aparência do avatar ao gravar os dados de treinamento. Considere as seguintes dicas:
Categorias | Dos | Não |
---|---|---|
Cabelo | - O cabelo do ator deve ter uma superfície lisa e brilhante. - Até mesmo a franja do ator ou o cabelo quebrado devem ter uma borda clara e lisa. - Escolha um penteado que seja fácil de manter consistente durante toda a gravação de vídeo. |
- Evite cabelos bagunçados ou fundos que apareçam através do cabelo. - Não deixe que o cabelo bloqueie os olhos ou as sobrancelhas. - Evite sombras no rosto causadas pelo penteado. - Evite mudanças de cabelo demais durante a fala e gestos corporais. Por exemplo, o rabo de cavalo alto de um ator pode aparecer, desaparecer e balançar durante a fala. |
Vestuário | - Preste atenção ao status da roupa e certifique-se de que não há mudanças significativas na roupa durante a fala. | - Evite usar roupas e acessórios muito soltos, pesados ou complexos, pois podem afetar a consistência do status da roupa durante a fala e o gesto corporal. - Evite usar roupas muito semelhantes à cor de fundo ou materiais reflexivos como camisas brancas ou materiais translúcidos. - Evite roupas com linhas óbvias ou itens com logotipos e nomes de marcas que você não quer destacar. - Evite elementos reflexivos como cintos de metal, sapatos de couro brilhante e calças de couro. |
Face | - Certifique-se de que o rosto do ator está claramente visível. | - Evite o rosto obscurecido pelo cabelo, óculos de sol ou acessórios. |
Que videoclipes gravar
Você precisa de vários tipos de clipes de vídeo básicos:
Vídeo de consentimento (obrigatório) O vídeo de consentimento é necessário para criar um avatar personalizado.
- O vídeo de consentimento deve representar o mesmo talento avatar falando, seguindo o requisito da declaração de consentimento. Certifique-se de que a declaração está corretamente gravada e que cada palavra é claramente falada. Você pode selecionar qualquer um dos idiomas suportados. Para saber mais sobre os requisitos do vídeo da declaração de consentimento, consulte Obter arquivo de consentimento do talento do avatar.
- O talento avatar deve sempre enfrentar a frente da câmera, sem grandes movimentos.
- O vídeo deve ser feito em um ambiente silencioso, e a voz deve ser gravada em um volume razoável. Tente manter a relação sinal-ruído superior a 20. Para obter orientações sobre gravação de voz, consulte o Guia de amostras de voz personalizadas de gravação.
- Certifique-se de que a parte da cabeça não será ocluída em cada quadro do vídeo.
- Certifique-se de que nenhum outro objeto aparece na câmera, incluindo equipamento de filmagem, telefone celular, etc.
Status 0 falando (Obrigatório para gestos) O clipe de vídeo de fala de status 0 é necessário para gestos com o avatar.
- O status 0 representa a postura que você pode manter naturalmente na maior parte do tempo enquanto fala. Por exemplo, braços cruzados na frente do corpo ou pendurados naturalmente nas laterais.
- Mantenha uma pose frontal. O ator pode se mover ligeiramente para mostrar um status relaxado, como mover ligeiramente a cabeça ou o ombro, mas não mova muito o corpo.
- Duração: continue falando no status 0 por 3-5 minutos.
Amostras de status 0 falando
Naturalmente falando (Obrigatório) O clipe de vídeo naturalmente falando é necessário para que o avatar fale naturalmente.
- Ator fala no status 0, mas com gestos naturais com as mãos de vez em quando.
- As mãos devem começar a partir do status 0 e retornar após fazer gestos.
- Use gestos naturais e comuns ao falar. Evite gestos significativos como apontar, aplaudir ou polegar para cima.
- Duração: Mínimo 5 minutos, máximo 30 minutos no total. É necessária pelo menos uma peça de gravação de vídeo contínua de 5 minutos. Se estiver gravando vários clipes de vídeo, mantenha cada clipe em menos de 10 minutos.
Amostras de fala natural
Status silencioso (Obrigatório) O clipe de vídeo de status silencioso é necessário. É importante se você construir uma conversa em tempo real com o avatar personalizado. O clipe de vídeo é usado como o modelo principal para o status de fala e audição para um chatbot.
- Mantenha o status 0, não fale, mas ainda se sinta relaxado.
- Mesmo permanecendo no status 0, não fique parado; Você pode se mover um pouco, mas não muito. Execute como se estivesse esperando.
- Mantenha um sorriso como se estivesse ouvindo ou esperando pacientemente.
- Evite acenar com a cabeça com frequência.
- Duração: 1 minuto.
Amostras de estado silencioso
Gestos (opcional)
Os clipes de vídeo por gestos são opcionais, e os clientes que têm a necessidade de inserir certos gestos no avatar falando podem seguir esta diretriz para fazer vídeos com gestos. A inserção de gestos só está ativada para avatar em modo batch; O avatar em tempo real não suporta a inserção de gestos neste momento. Cada modelo de avatar personalizado não pode suportar mais de 10 gestos.
Dicas de gestos
- Cada clipe de gesto deve estar dentro de 10 segundos.
- Os gestos devem começar com o status 0 e terminar com o status 0. É essencial que o personagem mantenha a mesma posição do status 0, que fica no meio da tela, durante todo o gesto. Caso contrário, o clipe de gestos não pode ser inserido suavemente no vídeo do avatar.
- O clipe de gestos captura apenas os gestos do corpo; o ator não precisa falar durante os gestos.
- Recomendamos criar uma lista de gestos antes de gravar; Aqui estão alguns exemplos de clipes de vídeo de gestos:
Amostras de gestos
Gestos | Exemplos |
---|---|
Entrega de link de venda/código promocional |
![]() |
Elogiar o produto |
![]() |
Apresentação do produto |
![]() |
Exibindo o preço (número de 1 a 10 punhos com cada mão) | Mão ![]() ![]() |
Os modelos de avatar de alta qualidade são construídos a partir de gravações de vídeo de alta qualidade, incluindo qualidade de áudio. Aqui estão mais dicas para o desempenho do ator e gravação de videoclipes:
Dos | Não |
---|---|
- Certifique-se de que todos os clipes de vídeo são feitos nas mesmas condições. - Durante o processo de gravação, projete o tamanho e a área de exibição do personagem que você precisa para que o personagem possa ser exibido na tela adequadamente. - Ator deve estar estável durante a gravação. - Expressões faciais mentais, que devem ser adequadas para o caso de uso do avatar. Por exemplo, pareça positivo e sorria se o avatar personalizado de texto para fala for usado como atendimento ao cliente. Olhe profissionalmente se o avatar é usado para reportagens. - Mantenha o olhar voltado para a câmera, mesmo ao usar um teleprompter. - Volte seu corpo ao status 0 ao parar de falar. - Fale sobre um tema escolhido por si mesmo, e pequenos erros de fala, como errar uma palavra ou pronunciar incorretamente, são aceitáveis. Se o ator errar uma palavra ou pronunciar algo errado, basta voltar ao status 0, fazer uma pausa de 3 segundos e continuar falando. - Faça uma pausa consciente entre frases e parágrafos. Ao fazer uma pausa, volte ao status 0 e feche os lábios. - O áudio deve ser claro e alto o suficiente; A má qualidade de áudio afeta o resultado do treinamento. - Mantenha o ambiente de filmagem silencioso. |
- Não ajuste os parâmetros da câmera, distância focal, posição, ângulo de visão. Não mova a câmera; manter a posição, tamanho, ângulo, consistente da pessoa na câmera.
- Caracteres muito pequenos podem levar a uma perda de qualidade de imagem durante o pós-processamento. Caracteres muito grandes podem fazer com que a tela transborde durante gestos e movimentos. - Não faça gestos muito longos ou muito movimento para um gesto; Por exemplo, as mãos do ator estão sempre fazendo gestos e esquecem de voltar ao status 0. - Os movimentos e gestos do ator não devem bloquear o rosto. - Evite pequenos movimentos do ator como lamber lábios, tocar cabelos, falar de lado, tremer constantemente a cabeça durante a fala e não se fechar depois de falar. - Evitar ruídos de fundo; A equipe deve evitar andar e falar durante a gravação de vídeo. - Evite a voz de outras pessoas gravada durante a fala do ator. |
Como preparar um videoclipe de interação
Criar um clipe de vídeo de interação de alta qualidade é essencial se você estiver construindo uma conversa em tempo real com um avatar personalizado. O clipe deve consistir em um formato de pergunta e resposta, onde um fotógrafo faz uma pergunta e o ator responde. Faça um loop do par pergunta-resposta até que a conversa esteja concluída. Se você está filmando sozinho, imagine outra pessoa fazendo as perguntas durante a fase de perguntas.
Aqui estão algumas dicas para cada fase:
Fase de pedido
- Mantenha o status 0, não fale, mas ainda se sinta relaxado.
- Mesmo permanecendo no status 0, não fique parado. Execute como se estivesse esperando.
- Mantenha um sorriso como se estivesse ouvindo ou esperando pacientemente.
- Evite acenar com a cabeça com frequência.
- Duração: Cada slot de pedido deve durar cerca de 3 a 5 segundos.
Fase de resposta
- Fale naturalmente com gestos naturais das mãos de vez em quando.
- Use gestos naturais e comuns ao falar. Evite gestos significativos como apontar, aplaudir ou polegar para cima.
- Comece os gestos depois de começar a falar e pare-os antes de terminar.
- Duração: Cada intervalo de resposta deve durar cerca de 5 segundos.
Duração total do vídeo
- Aponte para uma duração total do vídeo de 1 a 5 minutos.
Requisitos de dados
Fazer algum processamento básico de seus dados de vídeo é útil para a eficiência do treinamento do modelo, como:
- Certifique-se de que o personagem está no meio da tela, o tamanho e a posição são consistentes durante o processamento de vídeo. Cada parâmetro de processamento de vídeo, como brilho, contraste, permanece o mesmo e não muda. O tamanho, posição, brilho e contraste do avatar de saída refletirão diretamente os presentes nos dados de treinamento. Não aplicamos quaisquer alterações durante o processamento ou construção do modelo.
- O início e o fim do clipe devem ser mantidos no estado 0; Os atores devem fechar a boca, sorrir e olhar para a frente. O vídeo deve ser contínuo, não abrupto.
Formato de arquivo de gravação de vídeo de treinamento de avatar: .mp4 ou .mov.
Resolução: Pelo menos 1920x1080.
Taxa de quadros por segundo: Pelo menos 25 FPS.