Развертывание модели и извлечение сущностей из текста с помощью API среды выполнения
Статья
Если вы удовлетворены работой модели, значит она готова к развертыванию и использованию для распознавания сущностей в тексте. Развернутая модель становится доступной для использования через API прогнозирования.
Необходимые компоненты
Успешно созданный проект с настроенной учетной записью хранения Azure.
Текстовые данные, отправленные в учетную запись хранения.
После проверки производительности модели и принятия решения об ее использовании в имеющейся среде, необходимо назначить ее развертыванию. Назначаемая развертыванию модель становится доступной для использования с помощью API прогнозирования. Рекомендуется создать развертывание, называемое производственным, которому вы назначите созданную на данный момент лучшую модель, и будете использовать ее в своей системе. Можно создать другое развертывание, называемое промежуточным, которому можно назначить текущую рабочую модель, чтобы ее проверить. В проекте может быть не более 10 развертываний.
Выберите " Добавить развертывание", чтобы запустить новое задание развертывания.
Выберите Создать развертывание, чтобы создать развертывание и назначить обученную модель из раскрывающегося списка ниже. Можно также выбрать вариант Overwrite an existing deployment (Перезаписать существующее развертывание) и выбрать обученную модель, которую требуется назначить развертыванию, в раскрывающемся списке ниже.
Примечание.
Для перезаписи существующего развертывания не требуется вносить изменения в вызов API прогнозирования, но после этого вы будете получать результаты от новой назначенной модели.
Выберите "Развернуть" , чтобы запустить задание развертывания.
После успешного развертывания рядом с ним появится дата окончания срока действия. Окончание срока действия развертывания означает, что модель становится недоступной для использования в целях прогнозирования, что обычно происходит через двенадцать месяцев после окончания срока действия конфигурации обучения.
Отправка задания развертывания
Отправьте запрос PUT, используя следующий URL-адрес, заголовки и текст JSON, чтобы отправить задание развертывания. Замените значения заполнителей ниже собственными значениями.
Имя развертывания. Это значение учитывает регистр.
staging
{API-VERSION}
Версия вызываемого API. Указанное здесь значение определяет последнюю выпущенную версию модели. Дополнительные сведения о других доступных версиях API см. в статье Жизненный цикл модели.
2022-05-01
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст запроса
Используйте следующий код JSON в тексте запроса. Используйте имя модели, назначаемое развертыванию.
{
"trainedModelLabel": "{MODEL-NAME}"
}
Ключ
Заполнитель
Значение
Пример
trainedModelLabel
{MODEL-NAME}
Имя модели, которое будет назначено развертыванию. Имена можно назначить только успешно обученным моделям. Это значение учитывает регистр.
myModel
После отправки запроса API вы получите ответ 202, указывающий, что задание было отправлено правильно. Извлеките значение operation-location из заголовков ответа. Оно будет иметь следующий формат:
{JOB-ID} используется для идентификации запроса, так как эта операция является асинхронной. Этот URL-адрес можно использовать для получения состояния развертывания.
Получение состояния задания развертывания
Используйте следующий запрос GET для запроса состояния задания развертывания. Используйте URL-адрес, полученный на предыдущем шаге, или замените приведенные ниже значения заполнителей собственными значениями.
Имя развертывания. Это значение учитывает регистр.
staging
{JOB-ID}
Идентификатор для поиска состояния обучения модели. Это значение находится в заголовке location, полученном на предыдущем шаге.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API. Указанное здесь значение определяет последнюю выпущенную версию модели. Дополнительные сведения о других доступных версиях API см. в статье Жизненный цикл модели.
2022-05-01
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрос этой конечной точки до тех пор, пока значение параметра Состояние не изменится на "Выполнено". Необходимо получить код 200, указывающий на успешное выполнение запроса.
Если после завершения тестирования модели, назначенной одному развертыванию, вы хотите назначить эту модель другому развертыванию, можно переключить эти два развертывания. При переключении развертываний модель, назначенная первому развертыванию, назначается второму развертыванию. Затем модель, назначенная второму развертыванию, назначается первому развертыванию. Этот процесс можно использовать для переключений производственных и промежуточных развертываний, когда требуется взять модель, назначенную промежуточному развертыванию, и назначить ее производственному развертыванию.
Чтобы удалить развертывание из Студии Языка, перейдите на страницу Развертывание модели. Выберите развертывание, которое нужно удалить, и выберите пункт "Удалить развертывание " в верхнем меню.
Создайте запрос PUT, используя следующий URL-адрес, заголовки и текст JSON, чтобы удалить развертывание.
Имя, используемое для развертывания. Это значение учитывает регистр.
prod
{API-VERSION}
Версия вызываемого API. Указанное здесь значение определяет последнюю выпущенную версию модели. Дополнительные сведения о других доступных версиях API см. в статье Жизненный цикл модели.
2022-05-01
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
После отправки запроса API вы получите ответ 202, означающий успешное выполнение (развертывание было удалено). Ответ будет содержать заголовок Operation-Location, используемый для проверки состояния задания.
Перейдите на страницу развертывания модели в Language Studio.
Перейдите на вкладку "Регионы ".
Выберите " Добавить ресурс развертывания".
Выберите ресурс языка в другом регионе.
Теперь вы готовы развернуть проект в регионах, где назначены ресурсы.
Назначение ресурсов развертывания программным способом требует проверки подлинности Microsoft Entra. Идентификатор Microsoft Entra используется для подтверждения доступа к ресурсам, которые вы хотите назначить проекту для развертывания в нескольких регионах. Чтобы программно использовать проверку подлинности Microsoft Entra при вызове REST API, ознакомьтесь со статьей по службам ИИ Azure.
Назначить ресурс
Отправьте запрос POST с помощью следующего URL-адреса, заголовков и текста JSON для назначения ресурсов развертывания.
Запросить URL-адрес
При создании запроса API используйте следующий URL-адрес. Замените значения заполнителей ниже собственными значениями.
Настраиваемый поддомен ресурса, который требуется назначить. В портал Azure на вкладке "Ключи" и "Конечная точка" ресурса в качестве поля "Конечная точка" в URL-адресеhttps://<your-custom-subdomain>.cognitiveservices.azure.com/
contosoresource
region
{REGION-CODE}
Код региона, указывающий регион ресурса, который требуется назначить. Находится в портал Azure на вкладке "Ключи" и "Конечная точка" ресурса в поле "Расположение или регион".
eastus
Получение состояния ресурса
Используйте следующий запрос GET , чтобы получить состояние задания ресурса развертывания. Замените значения заполнителей ниже собственными значениями.
Идентификатор задания для получения состояния развертывания. Это значение заголовка, полученное operation-location от API в ответ на назначение запроса ресурса развертывания.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API.
2022-10-01-preview
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрашивать эту конечную точку, пока status параметр не изменится succeeded.
Полный путь к идентификатору ресурса, который требуется отменить. В портал Azure на вкладке "Свойства" ресурса в качестве поля "Идентификатор ресурса".
Используйте следующий запрос GET , чтобы получить состояние задания ресурсов развертывания unassign. Замените значения заполнителей ниже собственными значениями.
Идентификатор задания для получения состояния развертывания. Это значение заголовка, полученное operation-location от API в ответ на запрос ресурса развертывания unassign.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API.
2022-10-01-preview
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрос этой конечной точки до тех пор, пока значение параметра Состояние не изменится на "Выполнено".