Поделиться через


Lite для пользовательской нейронной голосовой связи (предварительная версия)

Служба "Речь ИИ Azure" предоставляет два типа проектов пользовательского нейронного голоса (CNV): CNV lite и CNV профессиональный.

  • Пользовательский специалист по нейронной голосовой связи (CNV) позволяет передавать данные обучения, собранные через профессиональные студии записи, и создавать более качественный голос, который почти неотличим от своих человеческих образцов. Профессиональный доступ CNV ограничен на основе критериев соответствия и использования. Запросите доступ в форме приема.
  • Пользовательский нейронный голос (CNV) — это тип проекта в общедоступной предварительной версии. Вы можете демонстрацию и оценку пользовательского нейронного голоса, прежде чем инвестировать в профессиональные записи, чтобы создать более качественный голос. Для демонстрации и оценки приложения не требуется. Однако корпорация Майкрософт ограничивает и выбирает примеры записи и тестирования для использования с CNV lite. Чтобы развернуть и использовать модель lite CNV для бизнеса, необходимо применить полный доступ к CNV профессиональным специалистам. В этом случае запросите доступ к форме приема.

С помощью проекта lite CNV вы записываете голосовую связь в Интернете, прочитав предварительно определенные скрипты 20-50, предоставляемые корпорацией Майкрософт. После записи как минимум 20 образцов можно начать обучение модели. После успешного обучения модели можно просмотреть модель и извлечь 20 выходных образцов, созданных с помощью другого набора предварительно определенных сценариев.

Поддерживаемые языки для Пользовательского нейронного голоса см. здесь.

Сравнение типов проектов

В следующей таблице приведены основные различия между типами проектов CNV lite и CNV профессиональных проектов.

Товаров Lite (предварительная версия) Профессионал
Целевые сценарии Демонстрация или вычисление Профессиональные сценарии, такие как озвучивание брендов и персонажей для чат-ботов или чтение аудиосодержимого.
Данные обучения Запись в сети с помощью Speech Studio Предоставление своих данных. Рекомендуется запись в профессиональной студии.
Скрипты для записи Предоставлено в Speech Studio Используйте собственные скрипты, которые соответствуют варианту использования. Корпорация Майкрософт предоставляет примеры скриптов для справки.
Требуемый размер данных 20-50 речевых фрагментов 300-2000 речевых фрагментов
Время обучения Менее одного часа вычислений Приблизительно 20-40 часов вычислений
Качество голоса Среднее качество Высокое качество
Availability Любой пользователь может записать образцы онлайн и обучить модель для демонстрации и оценки. Полный доступ к пользовательской нейронной голосовой связи необходим, если вы хотите развернуть модель lite CNV для бизнеса. Отправка данных не ограничена, но вы можете обучить и развернуть профессиональная модель CNV после утверждения доступа. Профессиональный доступ CNV ограничен на основе критериев соответствия и использования. Запросите доступ в форме приема.
Цены Цены на единицу применяются одинаково для профессиональных проектов CNV и CNV. Ознакомьтесь данными на странице цен. Цены на единицу применяются одинаково для профессиональных проектов CNV и CNV. Ознакомьтесь данными на странице цен.

Создание пользовательского проекта нейронной голосовой связи

Чтобы создать пользовательский проект lite для нейронной голосовой связи, выполните следующие действия.

  1. Войдите в службу Speech Studio.

  2. Выберите подписку и ресурс службы "Речь" для работы.

  3. Выберите "Создать проект" с помощью пользовательской голосовой связи>.

  4. Нажмите кнопку "Настраиваемый нейронный голос>" "Далее". Чтобы создать пользовательский проект для нейронного голоса, см . статью "Создание проекта для пользовательского нейронного голоса".

  5. Выполните инструкции, предлагаемые мастером создания проекта.

    Внимание

    Срок действия проекта CNV lite истекает через 90 дней, если только словесное заявление , записанное голосом таланта.

  6. Выберите новый проект по имени или щелкните Перейти к проекту. Эти пункты меню отображаются на левой панели: запись и сборка, проверка модели и развертывание модели.

    Снимок экрана: обзор записи, обучения, тестирования и развертывания CNV-записи.

Запись и сборка модели lite CNV

Запишите по крайней мере 20 примеров голосовой связи (до 50) с предоставленными скриптами в Интернете. Примеры голосовых данных, записанные здесь, используются для создания искусственной версии голоса.

Примечание.

Настраиваемое обучение нейронных голосов в настоящее время доступно только в некоторых регионах. Дополнительные сведения см. в сносках к таблице регионы.

Ниже приведены некоторые советы, которые помогут вам записать примеры голосовой связи:

  • Используйте хороший микрофон. Увеличьте ясность примеров с помощью высококачественного микрофона. Поговорите о 8 дюймах от микрофона, чтобы избежать шума рта.
  • Избегайте фонового шума. Запись в тихой комнате без фонового шума или эхо.
  • Расслабиться и поговорить естественно. Позвольте себе выразить эмоции, как вы читаете предложения.
  • Запись за один взять. Чтобы обеспечить согласованный уровень энергии, запишите все предложения в одном сеансе.
  • Проговорите каждое слово правильно и четко говорите.

Чтобы записать и создать модель lite CNV, выполните следующие действия.

  1. Выберите "Пользовательская голосовая запись> " и "Запись проекта >" и "Сборка".
  2. Выберите Приступая к работе.
  3. Внимательно ознакомьтесь с условиями использования талантов голосовой связи. Установите флажок, чтобы подтвердить условия использования.
  4. Выберите команду Accept (Принять).
  5. Нажмите значок микрофона, чтобы запустить проверку шума. Эта проверка шума занимает всего несколько секунд, и вам не нужно говорить во время него.
  6. Если обнаружен шум, нажмите кнопку "Проверить снова", чтобы повторить проверку шума. Если шум не обнаружен, нажмите кнопку "Готово" , чтобы перейти к следующему шагу. Снимок экрана: результаты проверки шума при обнаружении шума.
  7. Просмотрите советы по записи и выберите "Получил". Для получения наилучших результатов перейдите в тихую область без фонового шума перед записью ваших голосовых примеров.
  8. Нажмите значок микрофона, чтобы начать запись. Снимок экрана: пример панели мониторинга записи.
  9. Нажмите значок остановки, чтобы остановить запись.
  10. Просмотрите метрики качества. После записи каждого примера проверьте его метрики качества, прежде чем продолжать переход к следующему.
  11. Запишите дополнительные примеры. Хотя вы можете создать модель только с 20 примерами, рекомендуется записать до 50, чтобы повысить качество.
  12. Выберите "Обучение модели ", чтобы начать учебный процесс.

Процесс обучения занимает примерно один час вычислений. Ход обучения можно проверить на странице "Проверка модели ".

Проверка модели

Чтобы просмотреть модель lite CNV и слушать собственный искусственный голос, выполните следующие действия:

  1. Выберите пользовательскую модель> проверки имени >проекта. Здесь можно просмотреть имя голосовой модели, язык модели, размер данных образца и ход обучения. Имя голоса состоит из слова "Нейронная", добавленного к имени проекта.
  2. Выберите имя голосовой модели, чтобы просмотреть сведения о модели и прослушивать пример текста в результаты речи.
  3. Выберите значок воспроизведения, чтобы услышать голосовые слова каждого скрипта. Снимок экрана: пример панели мониторинга выходных данных проверки.

Отправка словесного заявления

Словесная инструкция, записанная талантом голоса, требуется, прежде чем можно развернуть модель для вашего бизнеса.

Чтобы отправить словесное заявление о голосовом таланте, выполните следующие действия:

  1. Выберите "Настраиваемый голос>" Имя >проекта "Развертывание модели>", чтобы управлять талантом голоса. Снимок экрана: панель мониторинга согласия для голосовых талантов.
  2. Выберите модель.
  3. Введите имя голосового таланта и название компании.
  4. Чтение и запись инструкции. Щелкните значок микрофона, чтобы начать запись. Выберите значок остановки, чтобы остановить запись.
  5. Нажмите кнопку "Отправить ", чтобы отправить инструкцию.
  6. Проверьте состояние обработки в таблице скриптов в нижней части панели мониторинга. После успешного выполнения состояния можно развернуть модель.

Развертывание модели

Чтобы развернуть голосовую модель и использовать ее в приложениях, необходимо получить полный доступ к пользовательскому нейронном голосу. Запросите доступ в форме приема. В течение примерно 10 рабочих дней вы получаете сообщение электронной почты с состоянием утверждения. Словесное заявление , записанное талантом голоса, также требуется, прежде чем можно развернуть модель для вашего бизнеса.

Чтобы развернуть модель lite CNV, выполните следующие действия.

  1. Выберите "Настраиваемый голос>", имя >проекта "Развертывание модели развертывания модели>".
  2. Выберите имя модели голосовой связи и нажмите кнопку "Далее".
  3. Введите имя и описание конечной точки, а затем нажмите кнопку "Далее".
  4. Установите флажок, чтобы согласиться с условиями использования, а затем нажмите кнопку "Далее".
  5. Выберите "Развернуть" , чтобы развернуть модель.

Здесь вы можете использовать модель голосовой связи CNV, аналогичную использованию профессиональной голосовой модели CNV. Например, можно приостановить или возобновить конечную точку после ее создания, чтобы ограничить расходы и сохранить ресурсы, которые не используются. Вы также можете получить доступ к голосу в средстве создания аудиоконтентов в Speech Studio.

Следующие шаги