Текстовый текст в контейнеры речи с помощью Docker

Статья
09/17/2024

Нейронный текст в контейнер речи преобразует текст в естественно-звуковую речь с помощью технологии глубокой нейронной сети, что позволяет более естественно синтезировать речь. Из этой статьи вы узнаете, как скачать, установить и запустить контейнер преобразования текста в речь.

Дополнительные сведения о предварительных требованиях, проверке запуска контейнера, выполнении нескольких контейнеров на одном узле и выполнении отключенных контейнеров см. в разделе "Установка и запуск контейнеров службы "Речь" с помощью Docker.

Образы контейнеров

Нейронный текст для образа контейнера речи для всех поддерживаемых версий и языковых стандартов можно найти в синдикате Реестра контейнеров Майкрософт (MCR). Он находится в репозитории azure-cognitive-services/speechservices/ и называется neural-text-to-speech.

Полное имя образа контейнера — mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech. Добавьте определенную версию или добавьте :latest ее, чтобы получить последнюю версию.

Версия	Путь
Latest	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest` Тег `latest` извлекает языковой стандарт `en-US` и голосовые данные `en-us-arianeural`.
3.5.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:3.5.0-amd64-en-us-arianeural`

Все теги, кроме latest, имеют следующий формат и учитывают регистр:

<major>.<minor>.<patch>-<platform>-<voice>-<preview>

Теги также доступны в формате JSON для удобства. Текст содержит путь к контейнеру и список тегов. Теги не отсортированы по версии, но "latest" всегда включаются в конец списка, как показано в этом фрагменте кода:

{
  "name": "azure-cognitive-services/speechservices/neural-text-to-speech",
  "tags": [
    <--redacted for brevity-->
    "3.5.0-amd64-uk-ua-ostapneural",
    "3.5.0-amd64-zh-cn-xiaochenneural-preview",
    "3.5.0-amd64-zh-cn-xiaohanneural",
    "3.5.0-amd64-zh-cn-xiaomoneural",
    "3.5.0-amd64-zh-cn-xiaoqiuneural-preview",
    "3.5.0-amd64-zh-cn-xiaoruineural",
    "3.5.0-amd64-zh-cn-xiaoshuangneural-preview",
    "3.5.0-amd64-zh-cn-xiaoxiaoneural",
    "3.5.0-amd64-zh-cn-xiaoyanneural-preview",
    "3.5.0-amd64-zh-cn-xiaoyouneural",
    "3.5.0-amd64-zh-cn-yunxineural",
    "3.5.0-amd64-zh-cn-yunyangneural",
    "3.5.0-amd64-zh-cn-yunyeneural",
    "latest"
  ]
}

Внимание

Мы отставили от стандартных голосов синтеза речи и стандартного текста в контейнер речи 31 августа 2021 года. Вместо этого следует использовать нейронные голоса с контейнером нейронного текста в речь версии 3.0 и выше.

Начиная с 29 февраля 2024 г. текст для речи и нейронного текста в контейнер речи версии 2.19 и более ранних версий не поддерживается. Дополнительные сведения об обновлении приложения см. в статье Переход со стандартного голоса на предварительно подготовленный нейронный голос.

Получение образа контейнера с помощью команды docker pull

Необходимые компоненты , включая необходимое оборудование. Также см. рекомендуемое выделение ресурсов для каждого контейнера службы "Речь".

Воспользуйтесь командой docker pull, чтобы скачать образ контейнера из реестра контейнеров Microsoft:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest

Внимание

Тег latest извлекает языковой стандарт en-US и голосовые данные en-us-arianeural. Дополнительные языковые параметры и голоса см . в виде текста для изображений контейнеров речи.

Запуск контейнера с помощью запуска Docker

Воспользуйтесь командой docker run для запуска контейнера.

Нейронный текст для речи
Отключенный нейронный текст для речи

В следующей таблице представлены различные параметры docker run и соответствующие им описания.

Параметр	Описание
`{ENDPOINT_URI}`	Для оценки и выставления счетов требуется конечная точка. Дополнительные сведения см . в разделе аргументов выставления счетов.
`{API_KEY}`	Ключ API не требуется. Дополнительные сведения см . в разделе аргументов выставления счетов.

При запуске текста в контейнер речи настройте порт, память и ЦП в соответствии с текстом для требований и рекомендаций к контейнеру речи.

Ниже приведен пример docker run команды со значениями заполнителей. Необходимо указать ENDPOINT_URI значения и API_KEY значения:

docker run --rm -it -p 5000:5000 --memory 12g --cpus 6 \
mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Команда:

Выполняет нейронный текст для контейнера речи из образа контейнера.
выделяет 6 ядер ЦП и 12 Гб памяти.
предоставляет TCP-порт 5000 и выделяет псевдотелетайп для контейнера;
автоматически удаляет контейнер после завершения его работы. Образ контейнера остается доступным на главном компьютере.

Чтобы запустить отключенные контейнеры (не подключенные к Интернету), необходимо отправить эту форму запроса и ждать утверждения. Дополнительные сведения о применении и приобретении плана обязательств по использованию контейнеров в отключенных средах см . в документации по службам ИИ Azure с использованием контейнеров в отключенных средах .

Если вы утверждены для запуска контейнера, отключенного от Интернета, в следующем примере показано форматирование используемой docker run команды с значениями заполнителей. Замените заполнители собственными значениями.

Параметр DownloadLicense=True в docker run команде скачивает файл лицензии, чтобы позволить контейнеру Docker запускаться, если он не подключен к Интернету. Он также содержит дату окончания срока действия, после чего файл лицензии недопустим для запуска контейнера. Файл лицензии можно использовать только с соответствующим контейнером, для которому вы утверждены. Например, нельзя использовать файл лицензии для speech-to-text контейнера с контейнером neural-text-to-speech .

Заполнитель	Description
`{IMAGE}`	Образ контейнера, который необходимо использовать. Например: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{LICENSE_MOUNT}`	Путь, по которому скачиваются лицензии и подключены. Например: `/host/license:/path/to/license/directory`
`{ENDPOINT_URI}`	Конечная точка для проверки подлинности запроса на обслуживание. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. Например: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	Ключ ресурса "Речь". Он представлен на странице ресурса Ключ и конечная точка на портале Azure.
`{CONTAINER_LICENSE_DIRECTORY}`	Расположение папки license в локальной файловой системе контейнера. Например: `/path/to/license/directory`

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

После скачивания файла лицензии можно запустить контейнер в отключенной среде. В следующем примере показано форматирование используемой docker run команды с значениями заполнителей. Замените заполнители собственными значениями.

Независимо от того, где выполняется контейнер, файл лицензии должен быть подключен к контейнеру, а расположение папки лицензии в локальной файловой системе контейнера необходимо указать с помощью Mounts:License=. Кроме того, необходимо указать выходное подключение, чтобы можно было записывать сведения об использовании для выставления счетов.

Заполнитель	Значение	Формат или пример
`{IMAGE}`	Образ контейнера, который необходимо использовать. Например: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{MEMORY_SIZE}`	Надлежащий объем памяти, который необходимо выделить для контейнера. Например: `4g`
`{NUMBER_CPUS}`	Надлежащее количество ЦП, которое необходимо выделить для контейнера. Например: `4`
`{LICENSE_MOUNT}`	Путь к расположению и подключенной лицензии. Например: `/host/license:/path/to/license/directory`
`{OUTPUT_PATH}`	Выходной путь для ведения журнала. Например: `/host/output:/path/to/output/directory` Дополнительные сведения см. в документации по службам искусственного интеллекта Azure.
`{CONTAINER_LICENSE_DIRECTORY}`	Расположение папки license в локальной файловой системе контейнера. Например: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	Расположение папки output в локальной файловой системе контейнера. Например: `/path/to/output/directory`

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Контейнеры службы "Речь" предоставляют каталог по умолчанию для записи файла лицензии и журнала выставления счетов во время выполнения. Каталоги по умолчанию: /license и /output соответственно.

При подключении этих каталогов к контейнеру с помощью команды docker run -v перед запуском контейнера обязательно задайте user:group nonroot:nonroot в качестве владельца каталога локального компьютера.

Ниже приведен пример команды для задания владения файлами и каталогами.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

Дополнительные сведения о контейнерах службы "Речь" см. в docker run разделе "Установка и запуск контейнеров службы "Речь" с помощью Docker.

Использование контейнера

Контейнеры службы "Речь" предоставляют API конечных точек запросов на основе websocket, к которым обращается пакет SDK службы "Речь" и CLI службы "Речь". По умолчанию пакет SDK службы "Речь" и cli службы "Речь" используют общедоступную службу "Речь". Чтобы использовать контейнер, вам необходимо изменить метод инициализации.

Внимание

При использовании службы "Речь" с контейнерами обязательно используйте проверку подлинности узла. Если вы настроите ключ и регион, запросы будут отправляться в общедоступную службу "Речь". Результаты службы "Речь" могут не быть ожидаемыми. Запросы от отключенных контейнеров завершаются ошибкой.