Использование конечных точек бессерверного API из другого проекта или концентратора Azure AI Foundry
В этой статье вы узнаете, как настроить существующую конечную точку API без сервера в другом проекте или концентраторе, отличном от используемой для создания развертывания.
Внимание
Модели, которые находятся в предварительной версии, помечены как предварительный просмотр на своих карточках моделей в каталоге моделей.
Некоторые модели в каталоге моделей можно развернуть как бессерверные API. Такой тип развертывания позволяет использовать модели в качестве API без размещения их в подписке, сохраняя корпоративную безопасность и соответствие требованиям, необходимым организациям. Этот параметр развертывания не требует квоты из подписки.
Необходимость использовать конечную точку API без сервера в другом проекте или концентраторе, отличном от используемой для создания развертывания, может возникнуть в таких ситуациях, как следующие:
- Вы хотите централизировать развертывания в определенном проекте или центре и использовать их из разных проектов или центров в вашей организации.
- Необходимо развернуть модель в концентраторе в определенном регионе Azure, где доступно бессерверное развертывание для этой модели. Однако его необходимо использовать из другого региона, где бессерверное развертывание недоступно для конкретных моделей.
Необходимые компоненты
Подписка Azure с допустимым методом оплаты. Бесплатные или пробные подписки Azure не будут работать. Если у вас нет подписки Azure, создайте платную учетную запись Azure, чтобы начать работу.
Центр Azure AI Foundry.
Проект Azure AI Foundry.
Модель , развернутая в конечной точке API без сервера. В этой статье предполагается, что вы ранее развернули модель Meta-Llama-3-8B-Instruct . Сведения о развертывании этой модели в качестве бессерверного API см. в статье "Развертывание моделей как бессерверных API".
Для работы с Azure AI Foundry необходимо установить следующее программное обеспечение:
Вы можете использовать любой совместимый веб-браузер для навигации по Azure AI Foundry.
Создание подключения конечной точки API без сервера
Выполните следующие действия, чтобы создать подключение:
Подключитесь к проекту или концентратору, где развернута конечная точка:
Перейдите в Azure AI Foundry и перейдите к проекту, к которому будет развернута конечная точка, к которой требуется подключиться.
Получите URL-адрес и учетные данные конечной точки, к которой вы хотите подключиться. В этом примере вы получите сведения о имени конечной точки meta-llama3-8b-qwerty.
На левой боковой панели проекта на портале Azure AI Foundry перейдите в раздел "Мои активы>" Модели и конечные точки", чтобы просмотреть список развертываний в проекте.
Выберите развертывание, к которому нужно подключиться.
Скопируйте значения для целевого URI и ключа.
Теперь подключитесь к проекту или концентратору , где необходимо создать подключение:
Перейдите в проект, в котором необходимо создать подключение.
Создайте подключение в проекте:
В проекте на портале Azure AI Foundry перейдите в нижнюю часть левой боковой панели и выберите центр управления.
В левой боковой панели центра управления выберите подключенные ресурсы.
Выберите Новое подключение.
Выберите бессерверную модель.
Для целевого URI вставьте скопированное ранее значение.
Для ключа вставьте скопированное ранее значение.
Присвойте соединению имя, в данном случае мета-лама3-8b-соединение.
Выберите Добавить подключение.
На этом этапе подключение доступно для потребления.
Чтобы убедиться, что подключение работает, выполните следующие действия.
Вернитесь к проекту на портале Azure AI Foundry.
В левой боковой панели проекта перейдите к разделу "Сборка и настройка>потока запроса".
Нажмите кнопку "Создать" , чтобы создать новый поток.
Выберите "Создать" в поле потока чата.
Присвойте потоку запроса имя и нажмите кнопку "Создать".
Выберите узел чата из графа, чтобы перейти к разделу чата.
Для подключения откройте раскрывающийся список, чтобы выбрать только что созданное соединение, в данном случае мета-ллома3-8b-соединение.
Выберите "Пуск сеанса вычислений " на верхней панели навигации, чтобы запустить автоматическую среду выполнения потока запросов.
Выберите параметр "Чат". Теперь вы можете отправлять сообщения и получать ответы.