Установка и запуск контейнеров беседы Распознавание речи (CLU)
Примечание.
Ограничения данных в одном синхронном вызове API для контейнера CLU составляют 5120 символов для каждого документа и до 10 документов на вызов.
Контейнеры позволяют размещать API CLU в собственной инфраструктуре. Если у вас есть требования к безопасности или управлению данными, которые не могут быть выполнены путем удаленного вызова CLU, контейнеры могут быть хорошим вариантом.
Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.
Необходимые компоненты
Перед использованием контейнеров CLU необходимо выполнить следующие предварительные требования.
- Если у вас еще нет подписки Azure, создайте бесплатную учетную запись.
- Docker, установленный на главном компьютере. Docker нужно настроить таким образом, чтобы контейнеры могли подключать и отправлять данные о выставлении счетов в Azure.
- В Windows для поддержки контейнеров Linux также должен быть настроен Docker.
- Необходимо знать основные принципы и основные понятия Docker.
- Ресурс языка
Сбор обязательных параметров
Требуются три основных параметра для всех контейнеров ИИ Azure. Для условий лицензионного соглашения на использование программного обеспечения корпорации Майкрософт должно быть задано значение accept. Также требуются URI конечной точки и ключ API.
URI конечной точки
Это {ENDPOINT_URI}
значение доступно на странице обзора портал Azure соответствующего ресурса служб ИИ Azure. Перейдите на страницу обзора, наведите указатель мыши на конечную точку и появится значок копирования в буфер обмена. Скопируйте и используйте конечную точку по мере необходимости.
Ключи
Значение {API_KEY}
используется для запуска контейнера и доступно на странице ключей портал Azure соответствующего ресурса служб ИИ Azure. Перейдите на страницу "Ключи" и щелкните значок копирования в буфер обмена.
Внимание
Эти ключи подписки используются для доступа к API служб искусственного интеллекта Azure. Не предоставляйте доступ к ключам другим пользователям. Храните их в безопасном месте. Например, используйте Azure Key Vault. Также рекомендуется регулярно повторно создавать эти ключи. Для вызова API необходим только один ключ. При повторном создании первого ключа второй ключ можно использовать для бесперебойного доступа к службе.
Требования к главному компьютеру и рекомендации
Узел — это 64-разрядный компьютер, на котором выполняется контейнер Docker. Это может быть компьютер в локальной среде или служба размещения Docker в Azure, включая следующие решения:
- Служба Azure Kubernetes.
- Экземпляры контейнеров Azure.
- Кластер Kubernetes, развернутый в Azure Stack. Дополнительные сведения см. в статье Развертывание Kubernetes в Azure Stack.
В нижеприведенной таблице описаны минимальные и рекомендуемые характеристики для доступных контейнеров. Частота каждого ядра ЦП должна быть минимум 2,6 ГГц.
Рекомендуется использовать ЦП с набором инструкций AVX-512 для оптимальной работы (производительности и точности).
Минимальные спецификации узла | Рекомендуемые спецификации узла | |
---|---|---|
CLU | 1 ядро, 2 ГБ памяти | 4 ядра, 8 ГБ памяти |
Ядро и память соответствуют параметрам --cpus
и --memory
, которые используются как часть команды docker run
.
Экспорт модели беседы Распознавание речи
Прежде чем продолжить выполнение образа Docker, необходимо экспортировать собственную обученную модель, чтобы предоставить ее контейнеру. Используйте следующую команду, чтобы извлечь модель и заменить заполнители ниже собственными значениями:
Заполнитель | Значение | Формат или пример |
---|---|---|
{API_KEY} | Ключ для языкового ресурса. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. | xxxx |
{ENDPOINT_URI} | Конечная точка для доступа к API беседы Распознавание речи. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{PROJECT_NAME} | Имя проекта, содержащего модель, которую требуется экспортировать. Его можно найти на вкладке проектов на портале Language Studio. | myProject |
{TRAINED_MODEL_NAME} | Имя обученной модели, которую вы хотите экспортировать. Вы можете найти обученные модели на вкладке оценки модели на портале Language Studio | myTrainedModel |
{EXPORTED_MODEL_NAME} | Имя, назначаемое для созданной экспортируемой модели. | myExportedModel |
curl --location --request PUT '{ENDPOINT_URI}/language/authoring/analyze-conversations/projects/{PROJECT_NAME}/exported-models/{EXPORTED_MODEL_NAME}?api-version=2024-11-15-preview' \
--header 'Ocp-Apim-Subscription-Key: {API_KEY}' \
--header 'Content-Type: application/json' \
--data-raw '{
"TrainedModelLabel": "{TRAINED_MODEL_NAME}"
}'
Получение образа контейнера с помощью docker pull
Образ контейнера CLU можно найти в mcr.microsoft.com
синдикате реестра контейнеров. Он находится в репозитории azure-cognitive-services/language/
и называется clu
. Полное имя образа контейнера — mcr.microsoft.com/azure-cognitive-services/language/clu
.
Чтобы использовать последнюю версию контейнера, можно использовать latest
тег, который предназначен для английского языка. Вы также можете найти полный список контейнеров для поддерживаемых языков с помощью тегов в MCR.
Последний контейнер CLU доступен на нескольких языках. Чтобы скачать контейнер для английского языка, используйте следующую команду.
docker pull mcr.microsoft.com/azure-cognitive-services/language/clu:latest
Совет
Используйте команду docker images, чтобы получить список скачанных образов контейнеров. Например, следующая команда возвращает таблицу со списком идентификаторов, репозиториев и тегов для каждого скачанного образа контейнера:
docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"
IMAGE ID REPOSITORY TAG
<image-id> <repository-path/name> <tag-name>
Запуск контейнера в режиме загрузки модели
После создания экспортируемой модели в приведенном выше разделе пользователям необходимо запустить контейнер, чтобы скачать пакет развертывания, созданный специально для экспортированных моделей.
Заполнитель | Значение | Формат или пример | |
---|---|---|---|
{API_KEY} | Ключ для языкового ресурса. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. | xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx | |
{ENDPOINT_URI} | Конечная точка для доступа к API. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
|
{IMAGE_TAG} | Тег Image, представляющий собой язык контейнера, который надо запустить. Убедитесь, что это совпадает с использованной командой docker pull . |
самый поздний | |
{LOCAL_CLU_PORT} | Номер порта, назначенный контейнеру на локальном компьютере. | 5000 | |
{LOCAL_MODEL_DIRECTORY} | Абсолютный каталог на хост-компьютере, в котором сохранены экспортированные модели. | C:\usr\local\myDeploymentPackage |
|
{PROJECT_NAME} | Имя проекта, к которому принадлежит экспортируемая модель | myProject | |
{EXPORTED_MODEL_NAME} | Экспортируемая модель для скачивания | myExportedModel |
docker run --rm -it -p {LOCAL_CLU_PORT}:80 \
mcr.microsoft.com/azure-cognitive-services/language/clu:{IMAGE_TAG} \
-v {LOCAL_MODEL_DIRECTORY}:/DeploymentPackage \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY} \
downloadmodel \
projectName={PROJECT_NAME} \
exportedModelName={EXPORTED_MODEL_NAME}
Не изменяйте скачанные файлы. Даже изменение структуры имени или папки может повлиять на целостность контейнера и может нарушить его.
Повторите эти действия, чтобы скачать столько моделей, сколько вы хотите протестировать. Они могут принадлежать разным проектам и иметь разные экспортированные имена моделей.
Запуск контейнера с помощью команды docker run
После добавления контейнера на главный компьютер используйте команду docker run для запуска контейнеров. Контейнер продолжает выполняться, пока не остановите его. Замените значения заполнителей ниже на собственные.
Внимание
- В командах Docker в следующих разделах используется обратная косая черта (
\
) как символ продолжения строки. Замените или удалите ее в соответствии с требованиями вашей операционной системы. - Для запуска контейнера необходимо указать параметры
Eula
,Billing
иApiKey
. В противном случае контейнер не запустится. Дополнительные сведения см. в разделе о выставлении счетов.
Чтобы запустить контейнер CLU, выполните следующую docker run
команду. Замените значения заполнителей ниже на собственные.
Заполнитель | Значение | Формат или пример |
---|---|---|
{API_KEY} | Ключ для языкового ресурса. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. | xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx |
{ENDPOINT_URI} | Конечная точка для доступа к API. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{IMAGE_TAG} | Тег Image, представляющий собой язык контейнера, который надо запустить. Убедитесь, что это совпадает с использованной командой docker pull . |
latest |
{LOCAL_CLU_PORT} | Номер порта, назначенный контейнеру на локальном компьютере. | 5000 |
{LOCAL_NER_PORT} | Номер порта контейнера NER. См. раздел "Запуск контейнера NER" ниже. | 5001 (должно отличаться от указанного выше номера порта) |
{LOCAL_LOGGING_DIRECTORY} | Абсолютный каталог на хост-компьютере, в котором сохраняются журналы. | C:\usr\local\mylogs |
{LOCAL_MODEL_DIRECTORY} | Абсолютный каталог на хост-компьютере, в котором сохранены экспортированные модели. | C:\usr\local\myDeploymentPackage |
docker run --rm -it -p 5000:5000 --memory 8g --cpus 1 \
mcr.microsoft.com/azure-cognitive-services/language/clu:{IMAGE_TAG} \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}
Команда:
- Запуск контейнера CLU из образа контейнера
- Выделение одного ядра ЦП и 8 гигабайт (ГБ) памяти.
- предоставляет TCP-порт 5000 и выделяет псевдотелетайп для контейнера;
- автоматически удаляет контейнер после завершения его работы. Образ контейнера остается доступным на главном компьютере.
Запуск нескольких контейнеров на одном узле
Если вы планируете запускать несколько контейнеров при открытых портах, обязательно назначьте каждому контейнеру отдельный открытый порт. Например, запускайте первый контейнер на порте 5000, а второй — на порте 5001.
Этот контейнер можно использовать и другой контейнер служб ИИ Azure, работающий вместе на узле HOST. Кроме того, можно использовать несколько контейнеров одного и того же контейнера служб искусственного интеллекта Azure.
Запуск контейнера NER
CLU использует NER для обработки предварительно созданных сущностей. Контейнер CLU работает должным образом без NER, если пользователи решили не интегрировать его. Выставление счетов NER отключается при использовании через CLU, если вызов не производится непосредственно в контейнер NER.
Настройка NER в контейнере CLU
- Следуйте документации по контейнеру NER.
- При запуске контейнера CLU установите параметр
Ner_Url
таким образом.Ner_Url=http://host.docker.internal:{LOCAL_NER_PORT}
Запрос конечной точки прогнозирования контейнера
Контейнер предоставляет интерфейсы REST API конечной точки прогнозирования запросов.
Используйте узел http://localhost:5000
для API контейнера.
Проверка состояния контейнера
Проверить это можно несколькими способами. Получите адрес и открытый порт для рассматриваемого контейнера из его параметра Внешний IP-адрес и запустите веб-браузер. Используйте приведенные ниже URL-адреса запросов, чтобы убедиться, что контейнер работает. В примерах в качестве URL-адресов запросов используется значение http://localhost:5000
, однако ваш конкретный контейнер может иметь отличия. Убедитесь в правильности внешнего IP-адреса и открытого порта контейнера.
Запросить URL-адрес | Характер использования |
---|---|
http://localhost:5000/ |
Контейнер предоставляет домашнюю страницу. |
http://localhost:5000/ready |
При запросе с помощью команды GET этот URL-адрес подтверждает, что контейнер готов принять запрос к модели. Этот запрос может использоваться для проб активности и готовности Kubernetes. |
http://localhost:5000/status |
Этот URL-адрес, который можно также запросить с помощью GET, проверяет, действителен ли ключ API, используемый для запуска контейнера, без запроса конечной точки. Этот запрос может использоваться для проб активности и готовности Kubernetes. |
http://localhost:5000/swagger |
Контейнер предоставляет полный набор документации по конечным точкам и функции Попробовать. Эта функция позволяет ввести параметры в веб-форму HTML и создать запрос без необходимости писать код. После возвращения результатов запроса предоставляется пример команды CURL с примером требуемого формата HTTP-заголовков и текста. |
Сведения о том, как вызвать CLU, см . в нашем руководстве.
Запуск контейнера, отключенного от Интернета
Чтобы использовать этот контейнер, отключенный от Интернета, необходимо сначала запросить доступ, заполнив приложение и приобретя план обязательств. Дополнительные сведения см. в разделе "Использование контейнеров Docker в отключенных средах ".
Если вы были утверждены для запуска контейнера, отключенного от Интернета, в следующем примере показано форматирование используемой docker run
команды с значениями заполнителей. Замените заполнители собственными значениями.
Параметр DownloadLicense=True
в docker run
команде скачит файл лицензии, который позволит запустить контейнер Docker, если он не подключен к Интернету. Он также содержит дату окончания срока действия, после которой файл лицензии станет недопустимым для запуска контейнера. Вы можете использовать файл лицензии только с тем контейнером, для которого получено утверждение. Например, нельзя использовать файл лицензии для преобразования речи в текстовый контейнер с контейнером аналитики документов.
Заполнитель | Значение | Формат или пример |
---|---|---|
{IMAGE} |
Образ контейнера, который необходимо использовать. | mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice |
{LICENSE_MOUNT} |
Путь для скачивания и подключения лицензии. | /host/license:/path/to/license/directory |
{ENDPOINT_URI} |
Конечная точка для проверки подлинности запроса на обслуживание. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{API_KEY} |
Ключ для ресурса Анализа текста. Он представлен на странице ресурса Ключ и конечная точка на портале Azure. | xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx |
{CONTAINER_LICENSE_DIRECTORY} |
Расположение папки license в локальной файловой системе контейнера. | /path/to/license/directory |
docker run --rm -it -p 5000:5000 \
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
После скачивания файла лицензии можно запустить контейнер в среде без подключения к Интернету. В следующем примере показано форматирование команды docker run
, которую вы будете использовать, с заполнителями. Замените заполнители собственными значениями.
Независимо от того, где выполняется контейнер, файл лицензии должен быть подключен к контейнеру, а расположение папки лицензии в локальной файловой системе контейнера необходимо указать с помощью Mounts:License=
. Кроме того, необходимо указать выходное подключение, чтобы можно было записывать сведения об использовании для выставления счетов.
Заполнитель | Значение | Формат или пример |
---|---|---|
{IMAGE} |
Образ контейнера, который необходимо использовать. | mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice |
{MEMORY_SIZE} |
Надлежащий объем памяти, который необходимо выделить для контейнера. | 4g |
{NUMBER_CPUS} |
Надлежащее количество ЦП, которое необходимо выделить для контейнера. | 4 |
{LICENSE_MOUNT} |
Путь для размещения и подключения лицензии. | /host/license:/path/to/license/directory |
{OUTPUT_PATH} |
Выходной путь для ведения журнала использования. | /host/output:/path/to/output/directory |
{CONTAINER_LICENSE_DIRECTORY} |
Расположение папки license в локальной файловой системе контейнера. | /path/to/license/directory |
{CONTAINER_OUTPUT_DIRECTORY} |
Расположение папки output в локальной файловой системе контейнера. | /path/to/output/directory |
docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \
-v {LICENSE_MOUNT} \
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}
Остановка контейнера
Чтобы завершить работу контейнера, в среде командной строки, где выполняется контейнер, нажмите комбинацию клавиш Ctrl+C.
Устранение неполадок
Если контейнер запускается с выходным подключением и включенным ведением журнала, контейнер создает файлы журнала, которые удобно использовать для устранения неполадок, возникающих во время запуска или работы контейнера.
Совет
Дополнительные сведения об устранении неполадок и рекомендации см. в статье часто задаваемые вопросы о контейнерах ИИ Azure.
Выставление счетов
Контейнеры CLU отправляют сведения о выставлении счетов в Azure с помощью ресурса языка в учетной записи Azure.
Запросы к контейнеру оплачиваются согласно ценовой категории ресурса Azure, используемого для параметра ApiKey
.
Контейнеры служб искусственного интеллекта Azure не лицензируются для запуска без подключения к конечной точке измерения или выставления счетов. Вам необходимо разрешить контейнерам непрерывную передачу данных для выставления счетов в конечную точку выставления счетов. Контейнеры служб искусственного интеллекта Azure не отправляют данные клиентов, такие как изображение или текст, которые анализируются, в корпорацию Майкрософт.
Подключение к Azure
Для запуска контейнера необходимо указать значения аргументов, касающихся выставления счетов. Эти значения обеспечивают подключение контейнера к конечной точке выставления счетов. Отчеты об использовании контейнера примерно каждые 10—15 минут. Если контейнер не подключится к Azure в течение допустимого периода времени, контейнер будет продолжать работать, но не будет обслуживать запросы, пока не будет восстановлена конечная точка выставления счетов. Попытки подключения выполняются 10 раз на протяжении одинакового интервала времени (10–15 минут). Если контейнеру не удается подключиться к конечной точке выставления счетов за 10 попыток, он останавливает запросы на обслуживание. Дополнительные сведения о выставлении счетов см. в контейнере служб искусственного интеллекта Azure.
Аргументы для выставления счетов
Команда docker run
запустит контейнер, когда все три из следующих параметров предоставляются допустимыми значениями:
Вариант | Описание |
---|---|
ApiKey |
Ключ API ресурса служб ИИ Azure, который используется для отслеживания сведений о выставлении счетов. Этому параметру следует присвоить значение ключа API для подготовленного ресурса, который можно получить в Billing . |
Billing |
Конечная точка ресурса служб искусственного интеллекта Azure, которая используется для отслеживания сведений о выставлении счетов. Этому параметру следует присвоить URI конечной точки подготовленного ресурса Azure. |
Eula |
Указывает, что вы приняли условия лицензии для контейнера. Для этого параметра следует задать значение accept. |
Дополнительные сведения об этих параметрах см. в статье Настройка контейнеров.
Итоги
В этой статье вы узнали основные понятия и рабочий процесс для скачивания, установки и запуска контейнеров CLU. Сводка:
- CLU предоставляет контейнеры Linux для Docker
- Образы контейнеров скачиваются из Реестра контейнеров Майкрософт (MCR).
- Образы контейнеров выполняются в Docker.
- При создании экземпляра контейнера нужно указать данные для выставления счетов.
Внимание
Контейнеры ИИ Azure не лицензируются для запуска без подключения к Azure для измерения. Клиенты должны разрешить контейнерам непрерывную передачу данных для выставления счетов в службу контроля потребления. Контейнеры ИИ Azure не отправляют данные клиента (например, анализируемый текст) в корпорацию Майкрософт.
Следующие шаги
- Параметры конфигурации см. в разделе Конфигурация контейнеров.