Использование конечных точек API без сервера из другой рабочей области
Из этой статьи вы узнаете, как настроить существующую конечную точку API без сервера в другой рабочей области, отличной от той, в которой она была развернута.
Некоторые модели в каталоге моделей можно развернуть как бессерверные API. Такой тип развертывания позволяет использовать модели в качестве API без размещения их в подписке, сохраняя корпоративную безопасность и соответствие требованиям, необходимым организациям. Этот параметр развертывания не требует квоты из подписки.
Необходимость использования конечной точки БЕССерверного API в другой рабочей области, отличной от используемой для создания развертывания, может возникнуть в таких ситуациях:
- Вы хотите централизировать развертывания в данной рабочей области и использовать их из разных рабочих областей в организации.
- Необходимо развернуть модель в рабочей области в определенном регионе Azure, где доступно бессерверное развертывание для этой модели. Однако его необходимо использовать из другого региона, где бессерверное развертывание недоступно для конкретных моделей.
Необходимые компоненты
Подписка Azure с допустимым методом оплаты. Бесплатные или пробные подписки Azure не будут работать. Если у вас нет подписки Azure, создайте платную учетную запись Azure, чтобы начать работу.
Рабочая область Машинное обучение Azure, в которой требуется использовать существующее развертывание.
Модель , развернутая в конечной точке API без сервера. В этой статье предполагается, что вы ранее развернули модель Meta-Llama-3-8B-Instruct . Сведения о развертывании этой модели в качестве бессерверного API см. в статье "Развертывание моделей как бессерверных API".
Для работы с Машинное обучение Azure необходимо установить следующее программное обеспечение:
Для навигации по Студия машинного обучения Azure можно использовать любой совместимый веб-браузер.
Создание подключения конечной точки API без сервера
Выполните следующие действия, чтобы создать подключение:
Подключитесь к рабочей области, в которой развернута конечная точка:
Перейдите к Студия машинного обучения Azure и перейдите в рабочую область, к которой будет развернута конечная точка, к которой требуется подключиться.
Получите URL-адрес и учетные данные конечной точки, к которой вы хотите подключиться. В этом примере вы получите сведения о имени конечной точки meta-llama3-8b-qwerty.
Выберите конечные точки на левой боковой панели.
Перейдите на вкладку "Бессерверные конечные точки", чтобы отобразить конечные точки API без сервера.
Выберите конечную точку, к которой нужно подключиться.
На вкладке сведений конечной точки скопируйте значения для целевого URI и ключа.
Теперь подключитесь к рабочей области , в которой необходимо создать подключение и использовать конечную точку.
Создайте подключение в рабочей области:
Перейдите в рабочую область, в которой необходимо создать подключение.
Перейдите в раздел "Управление" в левой панели навигации и выберите "Подключения".
Нажмите кнопку создания.
Выберите бессерверную модель.
Для целевого URI вставьте скопированное ранее значение.
Для ключа вставьте скопированное ранее значение.
Присвойте соединению имя, в данном случае мета-лама3-8b-соединение.
Выберите Добавить подключение.
На этом этапе подключение доступно для потребления.
Чтобы убедиться, что подключение работает, выполните следующие действия.
В левой панели навигации Студия машинного обучения Azure перейдите в поток запроса разработки>.
Нажмите кнопку "Создать" , чтобы создать новый поток.
Выберите "Создать" в поле потока чата.
Присвойте потоку запроса имя и нажмите кнопку "Создать".
Выберите узел чата из графа, чтобы перейти к разделу чата.
Для подключения откройте раскрывающийся список, чтобы выбрать только что созданное соединение, в данном случае мета-ллома3-8b-соединение.
Выберите "Пуск сеанса вычислений " на верхней панели навигации, чтобы запустить автоматическую среду выполнения потока запросов.
Выберите параметр "Чат". Теперь вы можете отправлять сообщения и получать ответы.