Развертывание моделей рабочих процессов оркестрации
Статья
Когда вы удовлетворены тем, как работает модель, она готова к развертыванию и запрашивает прогнозы из речевых фрагментов. Развернутая модель становится доступной для использования через API прогнозирования.
После проверки производительности модели и принятия решения об использовании в вашей среде модели необходимо назначить развертывание, чтобы иметь возможность запрашивать ее. Назначаемая развертыванию модель становится доступной для использования с помощью API прогнозирования. Рекомендуется создать развертывание production, которому вы назначите созданную на данный момент лучшую модель, и использовать его в своей системе. Можно создать другое развертывание, называемое staging и назначить ему текущую рабочую модель, чтобы ее проверить. В проекте может быть не более 10 развертываний.
Выберите " Добавить развертывание", чтобы запустить новое задание развертывания.
Выберите Создать развертывание, чтобы создать развертывание и назначить обученную модель из раскрывающегося списка ниже. Можно также выбрать вариант Overwrite an existing deployment (Перезаписать существующее развертывание) и выбрать обученную модель, которую требуется назначить развертыванию, в раскрывающемся списке ниже.
Примечание.
Для перезаписи существующего развертывания не требуется вносить изменения в вызов API прогнозирования, но после этого вы будете получать результаты от новой назначенной модели.
При подключении одного или нескольких приложений LUIS или проектов распознавания устной речи необходимо указать имя развертывания.
Для пользовательских ответов на вопросы и несвязанных намерений настройки не требуются.
Проекты LUIS должны быть опубликованы в слоте, настроенном во время развертывания оркестрации, а базы знаний пользовательских ответов на вопросы также должны быть опубликованы в рабочих слотах.
Выберите "Развернуть", чтобы отправить задание развертывания
После успешного развертывания рядом с ним появится дата окончания срока действия. Окончание срока действия развертывания означает, что модель становится недоступной для использования в целях прогнозирования, что обычно происходит через двенадцать месяцев после окончания срока действия конфигурации обучения.
Отправка задания развертывания
Создайте запрос PUT, используя указанный ниже URL-адрес, заголовки и текст JSON, чтобы приступить к развертыванию модели оркестрации рабочих процессов.
Имя, используемое для развертывания. Это значение учитывает регистр.
staging
{API-VERSION}
Версия вызываемого API.
2023-04-01
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст запроса
{
"trainedModelLabel": "{MODEL-NAME}",
}
Ключ
Заполнитель
Значение
Пример
trainedModelLabel
{MODEL-NAME}
Имя модели, которое будет назначено развертыванию. Имена можно назначить только успешно обученным моделям. Это значение учитывает регистр.
myModel
После отправки запроса API вы получите ответ 202, указывающий на успешное выполнение. Извлеките значение operation-location из заголовков ответа. Оно будет иметь следующий формат:
Имя, используемое для развертывания. Это значение учитывает регистр.
staging
{JOB-ID}
Идентификатор для поиска состояния обучения модели. Это значение заголовка location, полученное от API в ответ на запрос развертывания модели.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API.
2023-04-01
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрос этой конечной точки до тех пор, пока значение параметра Состояние не изменится на "Выполнено".
После завершения тестирования модели, назначенной одному развертыванию, вы можете назначить эту модель другому развертыванию. Переключение развертываний включает в себя:
Назначение модели, назначенной первому развертыванию, второму развертыванию.
Назначение модели, назначенной второму развертыванию, первому развертыванию.
Этот процесс можно использовать для переключений развертываний production и staging, когда требуется взять модель, назначенную развертыванию staging, и назначить ее развертыванию production.
Чтобы удалить развертывание из Language Studio, перейдите на страницу Развертывание модели. Выберите развертывание, которое нужно удалить, и выберите пункт "Удалить развертывание " в верхнем меню.
Создайте запрос DELETE, используя следующий URL-адрес, заголовки и текст JSON, чтобы удалить развертывание распознавания разговорной речи.
Перейдите на страницу развертывания модели в Language Studio.
Перейдите на вкладку "Регионы ".
Выберите " Добавить ресурс развертывания".
Выберите ресурс языка в другом регионе.
Теперь вы готовы развернуть проект в регионах, где назначены ресурсы.
Назначение ресурсов развертывания программным способом требует проверки подлинности Microsoft Entra**. Идентификатор Microsoft Entra используется для подтверждения доступа к ресурсам, которые вы хотите назначить проекту для развертывания в нескольких регионах. Сведения о программном использовании проверки подлинности Microsoft Entra при вызове REST API см. в документации по проверке подлинности служб искусственного интеллекта Azure.
Назначить ресурс
Отправьте запрос POST с помощью следующего URL-адреса, заголовков и текста JSON для назначения ресурсов развертывания.
Запросить URL-адрес
При создании запроса API используйте следующий URL-адрес. Замените значения заполнителей ниже собственными значениями.
Настраиваемый поддомен ресурса, который требуется назначить. В портал Azure на вкладке "Ключи" и "Конечная точка" ресурса в поле "Конечная точка" в URL-адресеhttps://<your-custom-subdomain>.cognitiveservices.azure.com/
contosoresource
region
{REGION-CODE}
Код региона, указывающий регион ресурса, который требуется назначить. Находится в портал Azure на вкладке "Ключи" и "Конечная точка" ресурса в поле "Расположение или регион".
eastus
Получение состояния ресурса
Используйте следующий запрос GET , чтобы получить состояние задания ресурса развертывания. Замените значения заполнителей ниже собственными значениями.
Идентификатор задания для получения состояния развертывания. Это значение заголовка, полученное operation-location от API в ответ на назначение запроса ресурса развертывания.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API.
2022-10-01-preview
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрос этой конечной точки до тех пор, пока значение параметра Состояние не изменится на "Выполнено".
Полный путь к идентификатору ресурса, который требуется отменить. В портал Azure на вкладке "Свойства" ресурса в качестве поля "Идентификатор ресурса".
Используйте следующий запрос GET , чтобы получить состояние задания ресурсов развертывания unassign. Замените значения заполнителей ниже собственными значениями.
Идентификатор задания для получения состояния развертывания. Это значение заголовка, полученное operation-location от API в ответ на запрос ресурса развертывания unassign.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API.
2022-10-01-preview
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрос этой конечной точки до тех пор, пока значение параметра Состояние не изменится на "Выполнено".