Развертывание проектов пользовательского языка в нескольких регионах
Примечание.
Эта статья относится к следующим пользовательским функциям на языке ИИ Azure:
Функции пользовательской языковой службы позволяют развертывать проект в нескольких регионах. Эта возможность позволяет значительно упростить доступ к проекту глобально, а управлять одним экземпляром проекта в одном месте. По состоянию на ноябрь 2024 года функции пользовательской языковой службы также позволяют развертывать проект в нескольких ресурсах в одном регионе через API, чтобы использовать настраиваемую модель везде, где требуется.
Перед развертыванием проекта можно назначить ресурсы развертывания в других регионах. Каждый ресурс развертывания — это другой ресурс языка, который используется для создания проекта. Вы развертываете эти ресурсы, а затем нацеливаете запросы прогнозирования на этот ресурс в соответствующих регионах, а запросы обслуживаются непосредственно из этого региона.
При создании развертывания можно выбрать, в каких из назначенных ресурсов развертывания и их соответствующих регионов вы хотите развернуть. Затем развернутая модель реплицируется в каждый регион и доступна с собственной конечной точкой, зависящей от настраиваемого поддомена ресурса развертывания.
Пример
Предположим, вы хотите убедиться, что проект, используемый в рамках чат-бота поддержки клиентов, доступен клиентами в США и Индии. Проект с именем ContosoSupport
создается с помощью ресурса MyWestUS2
языка "Западная часть США 2". Перед развертыванием необходимо назначить два ресурса развертывания проекту: MyEastUS
и MyCentralIndia
в восточной части США и Центральной Индии соответственно.
При развертывании проекта вы выбираете все три региона для развертывания: исходный регион "Западная часть США 2" и назначенные в восточной части США и Центральной Индии.
Теперь у вас есть три разных URL-адреса конечных точек для доступа к проекту во всех трех регионах:
- Западная часть США 2:
https://mywestus2.cognitiveservices.azure.com/language/:analyze-conversations
- Восточная часть США:
https://myeastus.cognitiveservices.azure.com/language/:analyze-conversations
- Центральная Индия:
https://mycentralindia.cognitiveservices.azure.com/language/:analyze-conversations
Один и тот же текст запроса для каждого из этих разных URL-адресов служит точному ответу непосредственно из этого региона.
Проверки и требования
Для назначения ресурсов развертывания требуется проверка подлинности Microsoft Entra. Идентификатор Microsoft Entra используется для подтверждения того, что у вас есть доступ к ресурсам, которые вы хотите назначить проекту для многорегионного развертывания. В Language Studio вы можете автоматически включить проверку подлинности Microsoft Entra, назначив себе роль владельца языка Azure Cognitive Services исходному ресурсу. Дополнительные сведения о программном использовании проверки подлинности Microsoft Entra см. в документации по службам искусственного интеллекта Azure.
Имя проекта и ресурс используются в качестве основных идентификаторов. Ресурс языка может иметь только определенное имя проекта в каждом ресурсе. Другие проекты с тем же именем не могут быть развернуты в этом ресурсе.
Например, если проект ContosoSupport
был создан ресурсом MyWestUS2
в западной части США 2 и развернут в ресурсе MyEastUS
на востоке США, ресурс MyEastUS
не может создать другой проект, называемый ContosoSupport
и развернуть проект в этом регионе. Аналогичным образом, ваши сотрудники не могут затем создать проект ContosoSupport
с ресурсом MyCentralIndia
в Центральной Индии и развернуть его в любом или MyWestUS2
MyEastUS
.
Вы можете переключать только развертывания, доступные в одинаковых регионах. В противном случае переключение завершается ошибкой.
При удалении назначенного ресурса из проекта удаляются все развертывания проекта в этом ресурсе.
Некоторые регионы доступны только для развертывания, а не для разработки проектов.
Связанный контент
Узнайте, как развертывать модели для: