Поделиться через


Справочник по API пользовательской голосовой связи — Azure Cognitive Services

В этой статье показано, как вызвать конечную точку REST API для пользовательской голосовой связи, службы в наборе Azure Cognitive Services. Пользовательский голос — это функция преобразования текста в речь, которая позволяет создать единственный в своем роде настраиваемый искусственный голос для приложений. С помощью пользовательского голоса вы можете создать очень естественный голос для вашего бренда или персонажей, предоставляя образцы человеческой речи в качестве обучающих данных. Существует два сценария использования пользовательского голоса: профессиональный и персональный. Чтобы получить представление о каждом сценарии и его требованиях к данным, ознакомьтесь с документами на профессиональном и личном мнениях.

Запрос доступа

Как профессиональный голос, так и персональный доступ к голосовой связи ограничен в зависимости от критериев допустимости и использования. Запросите доступ перед использованием REST API.

Создание профессионального голоса

Вызовите REST API, выполнив следующие действия.

  1. Create проект для профессионального голоса.
  2. Добавьте согласие актера озвучивания.
  3. Добавьте набор данных для профессионального обучения голосовой связи.
  4. Обучение профессиональной голосовой модели.
  5. Развертывание профессиональной голосовой модели в качестве конечной точки.
  6. Синтез с помощью пакета SDK для службы "Речь". (Он не является частью этого API. Ознакомьтесь с документом.)

Создание личного голоса

Вызовите REST API, выполнив следующие действия.

  1. Create проект для личного голоса.
  2. Добавьте согласие пользователя.
  3. Create личный голос и получить идентификатор профиля говорящего.
  4. Синтез с помощью пакета SDK для службы "Речь". (Он не является частью этого API. Ознакомьтесь с документом.)

Примеры

Пример кода API пользовательской голосовой связи

См. также раздел