Поделиться через


Развертывание моделей Azure OpenAI с помощью Azure AI Foundry

Внимание

Элементы, обозначенные в этой статье как (предварительная версия), сейчас предлагаются в общедоступной предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.

Из этой статьи вы узнаете, как создать развертывания модели Azure OpenAI на портале Azure AI Foundry.

Служба Azure OpenAI предлагает разнообразный набор моделей с разными возможностями и ценовыми точками. При развертывании моделей Azure OpenAI на портале Azure AI Foundry можно использовать развертывания, используя поток запроса или другое средство. Доступность модели зависит от региона. Дополнительные сведения о каждой модели см. в разделе Модели Службы Azure OpenAI.

Чтобы изменить и взаимодействовать с моделью Azure OpenAI на детской площадке Azure AI Foundry , сначала необходимо развернуть базовую модель Azure OpenAI в проекте. После развертывания и доступности модели в проекте можно использовать конечную точку REST API как есть или настроить дальше с собственными данными и другими компонентами (внедрение, индексы и многое другое).

Необходимые компоненты

  • Подписка Azure с допустимым методом оплаты. Бесплатные или пробные подписки Azure не будут работать. Если у вас нет подписки Azure, создайте платную учетную запись Azure, чтобы начать работу.

  • Проект Azure AI Foundry.

Развертывание модели Azure OpenAI из каталога моделей

Выполните приведенные ниже действия, чтобы развернуть модель Azure OpenAI, например gpt-4o-mini в конечной точке в режиме реального времени из каталога моделей портала AI Foundry:

  1. Войдите в Azure AI Foundry.
  2. Если вы еще не находитесь в проекте, выберите его.
  3. Выберите каталог моделей в левой области навигации.
  1. В фильтре коллекций выберите Azure OpenAI.

    Снимок экрана: фильтрация по моделям Azure OpenAI в каталоге.

  2. Выберите модель, gpt-4o-mini например из коллекции Azure OpenAI.

  3. Выберите "Развернуть" , чтобы открыть окно развертывания.

  4. Выберите ресурс, в который нужно развернуть модель. Если у вас нет ресурса, его можно создать.

  5. Укажите имя развертывания и измените другие параметры по умолчанию в зависимости от ваших требований.

  6. Выберите Развернуть.

  7. Вы приземлились на странице сведений о развертывании. Выберите "Открыть на площадке".

  8. Выберите представление кода , чтобы получить примеры кода, которые можно использовать для использования развернутой модели в приложении.

Развертывание модели Azure OpenAI из проекта

Кроме того, можно инициировать развертывание, начиная с проекта на портале AI Foundry.

  1. Перейдите к проекту на портале AI Foundry.
  2. В левой боковой панели проекта перейдите в раздел "Мои активы>" Модели и конечные точки".
  3. Выберите и разверните>базовую модель.
  4. В фильтре коллекций выберите Azure OpenAI.
  5. Выберите модель, gpt-4o-mini например из коллекции Azure OpenAI.
  6. Выберите "Подтвердить" , чтобы открыть окно развертывания.
  7. Укажите имя развертывания и измените другие параметры по умолчанию в зависимости от ваших требований.
  8. Выберите Развернуть.
  9. Вы приземлились на странице сведений о развертывании. Выберите "Открыть на площадке".
  10. Выберите представление кода , чтобы получить примеры кода, которые можно использовать для использования развернутой модели в приложении.

Вывод модели Azure OpenAI

Для выполнения вывода в развернутой модели можно использовать игровые площадки или примеры кода. Детская площадка — это веб-интерфейс, позволяющий взаимодействовать с моделью в режиме реального времени. С помощью игровой площадки можно протестировать модель с различными запросами и просмотреть ответы модели.

Дополнительные примеры использования развернутой модели в приложении см. в следующих кратких руководствах по Azure OpenAI:

Ограничения региональной доступности и квоты модели

Стандартная квота для моделей Azure OpenAI зависит от модели и региона. Отдельные модели доступны только в некоторых регионах. Дополнительные сведения об ограничениях доступности и квотах см. в разделе квоты и ограничения службы OpenAI Azure.

Квота для развертывания и вывода модели

Для моделей Azure OpenAI развертывание и вывод используют квоту, назначенную вашей подписке в каждом регионе на основе единиц токенов в минуту (TPM). При регистрации в Azure AI Foundry вы получаете квоту по умолчанию для большинства доступных моделей. Затем вы назначаете доверенному платформенный модуль каждому развертыванию по мере его создания, что позволяет сократить доступную квоту для этой модели на сумму, которую вы назначили. Вы можете продолжать создавать развертывания и назначать их TPM, пока не достигнете предела квоты.

Когда вы достигнете предела квоты, единственным способом создания новых развертываний этой модели является:

  • Запросите дополнительную квоту, отправив форму увеличения квоты.
  • Настройте выделенную квоту для других развертываний моделей, чтобы освободить маркеры для новых развертываний на портале Azure OpenAI.

Дополнительные сведения о квоте см. в статье "Квота Azure AI Foundry " и "Управление квотой службы Azure OpenAI".

  • Дополнительные сведения о том, что можно сделать в Azure AI Foundry
  • Ответы на часто задаваемые вопросы и ответы по Azure AI