Справочник по API пользовательской голосовой связи — Azure Cognitive Services
В этой статье показано, как вызвать конечную точку REST API для пользовательской голосовой связи, службы в наборе Azure Cognitive Services. Пользовательский голос — это функция преобразования текста в речь, которая позволяет создать единственный в своем роде настраиваемый искусственный голос для приложений. С помощью пользовательского голоса вы можете создать очень естественный голос для вашего бренда или персонажей, предоставляя образцы человеческой речи в качестве обучающих данных. Существует два сценария использования пользовательского голоса: профессиональный и персональный. Чтобы получить представление о каждом сценарии и его требованиях к данным, ознакомьтесь с документами на профессиональном и личном мнениях.
Запрос доступа
Как профессиональный голос, так и персональный доступ к голосовой связи ограничен в зависимости от критериев допустимости и использования. Запросите доступ перед использованием REST API.
Создание профессионального голоса
Вызовите REST API, выполнив следующие действия.
- Create проект для профессионального голоса.
- Добавьте согласие актера озвучивания.
- Добавьте набор данных для профессионального обучения голосовой связи.
- Обучение профессиональной голосовой модели.
- Развертывание профессиональной голосовой модели в качестве конечной точки.
- Синтез с помощью пакета SDK для службы "Речь". (Он не является частью этого API. Ознакомьтесь с документом.)
Создание личного голоса
Вызовите REST API, выполнив следующие действия.
- Create проект для личного голоса.
- Добавьте согласие пользователя.
- Create личный голос и получить идентификатор профиля говорящего.
- Синтез с помощью пакета SDK для службы "Речь". (Он не является частью этого API. Ознакомьтесь с документом.)
Примеры
Пример кода API пользовательской голосовой связи
См. также раздел
- Swagger в API пользовательской голосовой связи
- Сведения о создании ресурса Azure Cognitive Service см. в статье Начало работы с Azure Cognitive Service.