Запись примеров видео для пользовательского текста в аватар речи
В этой статье приведены инструкции по подготовке высококачественных примеров видео для создания пользовательского текста для аватара речи.
Для создания модели аватара пользовательского текста для речи требуется обучение видео записи реального человека. Этот человек является аватар талантом. Вы должны получить достаточное согласие в соответствии со всеми соответствующими законами и правилами от таланта аватара, чтобы создать настраиваемый аватар на основе образа или сходства своего таланта. Дополнительные сведения о требованиях видео о согласии см. в разделе "Получение файла согласия" от таланта аватара.
Среда записи
Мы рекомендуем записывать в профессиональной студии видеозаписи или хорошо освещенное место.
Требование к фоновому режиму
Если вам нужен коммерческий, мультикаранный аватар, фон видео должен быть чистым, гладким, чистым цветом, и зеленый экран является лучшим выбором.
Если аватар должен использоваться только в одной сцене, можно выбрать определенную сцену для записи (например, в офисе), но фон не может быть вычитан и изменен.
Ниже приведены рекомендации по использованию чисто цветного фона (например, зеленого экрана) для записи:
- Зеленый экран установлен за спиной, и если аватар видео показывает полное тело актера, включая ноги, должен быть зеленый экран под ногами. И зеленый экран заднего цвета и зеленый экран пола должен быть легко подключен.
- Зеленый экран должен быть неструктурированным, и цвет является универсальным.
- Актер должен держать 0,5 м – 1 м расстояние от заднего фона.
- Зеленый экран можно правильно осветить, чтобы предотвратить тени.
- Полный контур субъекта находится в краю зеленого экрана.
- Актер не должен стоять слишком близко к зеленому экрану.
- Избегайте того, чтобы голова и руки актера вылились из зеленого экрана при разговоре.
Требование освещения
- Обеспечьте даже и яркое освещение на лице актера, избегая тени на лице или отражения на очках и одежде актера.
- Старайтесь избежать изменений в окружающем свете на актерах. Рекомендуется отключить проектор, закрыть шторы, чтобы избежать изменений дневного света, и использовать стабильный искусственный источник света и т. д.
.
- Требование камеры: не менее 1080-P разрешение и 25 FPS (кадры в секунду).
- Не изменяйте положение света и камеры после урегулирования во время всей съемки видео.
- Вы можете использовать телепроимптер, чтобы напомнить скрипту во время записи, но убедиться, что он не влияет на взгляд актера к камере. Предоставьте место, чтобы сидеть, если аватар должен находиться в положении сидящего.
- Для половины длины или сидящих цифровых аватаров предоставьте место для актера. Если вы не хотите, чтобы изображение стула появилось, вы можете выбрать стул.
Внешний вид субъекта
Пользовательский текст для аватара речи не поддерживает настройку одежды или внешний вид. Поэтому необходимо тщательно разработать и подготовить внешний вид аватара при записи обучающих данных. Рассмотрим следующие советы:
Категории | Дос | Не давайте |
---|---|---|
Волос | - Волосы актера должны иметь гладкую и глянцевую поверхность. - Даже удары актера или сломанные волосы должны иметь четкую и гладкую границу. — Выберите прическу, которую легко сохранить согласованно во время всей записи видео. |
- Избегайте грязных волос или фонов, показывающих через волосы. - Не позволяйте волосам блокировать глаза или брови. - Избегайте теней на лице, вызванной прическами. - Избегайте изменений волос слишком много во время речи и жеста тела. Например, высокий ponytail актера может появиться, исчезнуть и качнуться во время выступления. |
Clothing | - Обратите внимание на состояние одежды и убедитесь, что никаких существенных изменений на одежде во время выступления. | - Избегайте носить одежду и аксессуары, которые слишком свободны, тяжелые или сложные, так как они могут повлиять на согласованность состояния одежды во время говорить и жест тела. - Избегайте носить одежду, которая слишком похожа на цвет фона или отраженные материалы, такие как белые рубашки или полупрозрачные материалы. - Избегайте одежды с очевидными линиями или элементами с логотипами и фирменными именами, которые вы не хотите выделить. - Избегайте отраженных элементов, таких как металлические пояса, блестящие кожаные обувь и кожаные брюки. |
Распознавание лиц | - Убедитесь, что лицо субъекта четко видно. | - Избегайте лица, закроемого волосами, солнцезащитными очками или аксессуарами. |
Какие клипы для записи
Вам потребуется несколько типов базовых видеоклипов:
Видео согласия (обязательно) Видео согласия требуется для создания пользовательского аватара.
- Видео согласия должно представлять тот же аватар талант говорить, следуя требованию заявления о согласии. Убедитесь, что инструкция правильно записана, и каждое слово четко говорится. Вы можете выбрать любой из поддерживаемых языков. Дополнительные сведения о требованиях видео о согласии см. в разделе "Получение файла согласия" от таланта аватара.
- Аватар талант всегда должен столкнуться с передней частью камеры, без больших движений.
- Видео должно быть принято в тихой среде, и голос должен быть записан на разумном томе. Попробуйте сохранить соотношение сигналов к шуму выше 20. Рекомендации по записи голосовых данных см. в руководстве по записи пользовательских примеров голосовых данных .
- Убедитесь, что головная часть не будет окклюдирована в каждом кадре видео.
- Убедитесь, что другие объекты не отображаются в камере, включая оборудование для съемки, мобильный телефон и т. д.
Состояние 0 речи (требуется для жестов) Состояние 0 говорить видео клип требуется для жестов с аватаром.
- Состояние 0 представляет позы, которые вы можете естественно поддерживать большую часть времени при разговоре. Например, руки пересекаются перед телом или висят естественно на сторонах.
- Сохраняйте позу переднего плана. Актер может немного двигаться, чтобы показать расслабленное состояние, как перемещение головы или плеча немного, но не двигайте тело слишком много.
- Длина: продолжайте говорить в состоянии 0 в течение 3-5 минут.
Примеры состояния 0 говоря
Естественно говоря (Обязательно) Естественно говоря видео клип требуется для аватара, чтобы говорить естественно.
- Актер говорит в состоянии 0, но с естественными жестами руки время от времени.
- Руки должны начинаться с состояния 0 и возвращать после жестов.
- Используйте естественные и распространенные жесты при разговоре. Избегайте значимых жестов, таких как указание, аплодисменты или пальцы вверх.
- Длина: минимум 5 минут, максимум 30 минут в общей сложности. Требуется по крайней мере одна часть 5-минутной непрерывной записи видео. При записи нескольких клипов сохраните каждый клип в течение 10 минут.
Примеры естественного речи
Автоматическое состояние (обязательно) Требуется автоматическое видеообращение состояния. Важно, если вы создаете беседу в режиме реального времени с пользовательским аватаром. Видеоматериал используется в качестве основного шаблона для выступления и прослушивания состояния чат-бота.
- Поддерживать состояние 0, не говорить, но по-прежнему чувствовать себя расслабленным.
- Даже оставшийся в состоянии 0, не сохраняйте по-прежнему; вы можете немного двигаться, но не слишком много. Выполняйте, как вы ждете.
- Сохраняйте улыбку, как будто слушая или ожидая терпеливо.
- Избегайте кивления часто.
- Длина: 1 минуту.
Примеры автоматического состояния
Жесты (необязательно)
Видеоклипы жестов являются необязательными, и клиенты, которым требуется вставить определенные жесты в аватаре, могут следовать этому руководству, чтобы принять видео жестов. Вставка жестов включена только для аватара в пакетном режиме; Аватар в режиме реального времени не поддерживает вставку жестов на данный момент. Каждая пользовательская модель аватара может поддерживать не более 10 жестов.
Советы по жестам
- Каждый клип жеста должен находиться в пределах 10 секунд.
- Жесты должны начинаться с состояния 0 и заканчиваться состоянием 0. Важно, чтобы символ поддерживал ту же позицию, что и в состоянии 0, которая находится в середине экрана на протяжении всего жеста. В противном случае клип жеста не может быть плавно вставлен в видео аватара.
- Клип жеста фиксирует только жесты тела; актеру не нужно говорить во время жестов.
- Перед записью рекомендуется разработать список жестов; Ниже приведены некоторые примеры видеоклипов жестов:
Примеры жеста
Жесты | Примеры |
---|---|
Доставка кода ссылки на продажу и продвижение | |
Прахимирование продукта | |
Знакомство с продуктом | |
Отображение цены (число от 1 до 10-fist-число с каждой рукой) | Левая рука правой руки |
Высококачественные модели аватаров создаются из высококачественных видеозаписей, включая качество звука. Ниже приведены дополнительные советы по производительности актера и записи видео клипов:
Дос | Не давайте |
---|---|
— Убедитесь, что все клипы выполняются в одинаковых условиях. — Во время процесса записи создайте размер и область отображения нужного символа, чтобы символ отображался на экране соответствующим образом. — Субъект должен быть устойчивым во время записи. — Помните о выражениях лица, которые должны быть подходящими для варианта использования аватара. Например, выглядеть положительно и улыбаться, если в качестве обслуживания клиентов используется пользовательский текст для аватара речи. Выглядеть профессионально, если аватар используется для новостей. - Поддерживать взгляд на камеру, даже при использовании телепроимптера. — Возвращает тело к состоянию 0 при приостановке речи. - Говорить по самостоятельно выбранной теме, и незначительные ошибки речи, такие как пропустить слово или неправильно пропрогнозированы, допустимы. Если субъект пропускает слово или неправильно произносит что-то, просто вернитесь к состоянию 0, приостанавливайтесь в течение 3 секунд, а затем продолжайте говорить. - Сознательно приостанавливается между предложениями и абзацами. При приостановке вернитесь к состоянию 0 и закройте губы. - Звук должен быть четким и громким; плохое качество звука влияет на результат обучения. - Оставайтесь в спокойной среде съемки. |
— Не настраивайте параметры камеры, фокусовую длину, положение, угол зрения. Не перемещайте камеру; держите положение человека, размер, угол, согласованный в камере. — Символы, которые слишком малы, могут привести к потере качества изображения во время последующей обработки. Слишком большие символы могут привести к переполнению экрана во время жестов и движений. - Не делайте слишком длинные жесты или слишком много движения для одного жеста; Например, руки субъекта всегда делают жесты и забудьте вернуться к состоянию 0. - Движения и жесты актера не должны блокировать лицо. - Избегайте небольших движений актера, как лизание губ, касание волос, разговор боковой стороны, константная голова трясется во время речи, а не закрываясь после выступления. - Избегайте фонового шума; сотрудники должны избегать прогулки и говорить во время записи видео. - Избегайте голоса других людей, записанных во время выступления актера. |
Подготовка видеоклипа взаимодействия
Создание высококачественного видеоклипа взаимодействия важно, если вы создаете беседу в режиме реального времени с пользовательским аватаром. Клип должен состоять из формата вопросов и ответов, где фотограф задает вопрос, и актер отвечает. Проциклив пару ответов на вопросы, пока не завершится беседа. Если вы снимаете в одиночку, представьте, кто-то другой задает вопросы во время задавая этап.
Ниже приведены некоторые советы по каждому этапу.
Этап запроса
- Поддерживать состояние 0, не говорить, но по-прежнему чувствовать себя расслабленным.
- Даже оставшиеся в состоянии 0, не сохраняйте все еще. Выполняйте, как вы ждете.
- Сохраняйте улыбку, как будто слушая или ожидая терпеливо.
- Избегайте кивления часто.
- Длина: каждый запрашивающий слот должен длиться около 3–5 секунд.
Этап ответа
- Говорить естественно с естественными жестами рук от времени до времени.
- Используйте естественные и распространенные жесты при разговоре. Избегайте значимых жестов, таких как указание, аплодисменты или пальцы вверх.
- Начните жесты после начала говорить и остановите их до завершения.
- Длина: каждый слот ответа должен длиться около 5 секунд.
Общая длина видео
- Нацелитесь на общую длину видео в 1–5 минут.
Требования к данным
Выполнение некоторой базовой обработки видеоданных полезно для повышения эффективности обучения модели, например:
- Убедитесь, что символ находится в середине экрана, размер и положение согласованы во время обработки видео. Каждый параметр обработки видео, например яркость, контрастность остается одинаковой и не изменяется. Размер, позиция, яркость, контрастность выходных аватаров будет отражать непосредственно те, которые присутствуют в обучающих данных. Мы не применяем никаких изменений во время обработки или сборки моделей.
- Начало и конец клипа должны храниться в состоянии 0; актеры должны закрывать рот и улыбаться, и смотреть вперед. Видео должно быть непрерывным, а не резким.
Формат файла записи видео для аватара: .mp4 или .mov.
Разрешение: по крайней мере 1920x1080.
Частота кадров в секунду: по крайней мере 25 FPS.