Создание служба ИИ Azure в портал Azure
Поиск ИИ Azure — это платформа получения сведений для предприятия. Он поддерживает традиционный поиск и беседы, управляемый ИИ, для поиска "чата с данными" в вашем закрытом контенте.
Самый простой способ создать службу поиска — это портал Azure, которая рассматривается в этой статье.
Кроме того, можно использовать следующую команду:
- Azure PowerShell
- Azure CLI
- Интерфейс API REST для управления.
- Шаблон Azure Resource Manager
- Bicep
- Terraform
Перед началом работы
Некоторые свойства исправлены для времени существования службы поиска. Перед созданием службы определите следующие свойства:
Свойство | Описание |
---|---|
Имя | Становится частью конечной точки URL-адреса. Имя должно быть уникальным и следовать правилам именования. |
Регион | Определяет расположение данных и доступность определенных функций. Например, семантический рангировщик и интеграция СИ Azure имеют требования к регионам. Выберите регион, поддерживающий необходимые функции. |
Уровень | Определяет инфраструктуру, ограничения служб и выставление счетов. Некоторые функции недоступны на более низких или специализированных уровнях. |
Подписка на Azure
Для поиска ИИ Azure требуется бесплатная подписка Azure с оплатой по мере использования.
Чтобы бесплатно попробовать поиск azure AI, запустите пробную подписку и создайте службу поиска на уровне "Бесплатный". Каждая подписка Azure может иметь одну бесплатную службу поиска, предназначенную для краткосрочной, непроизводной оценки продукта. Вы можете выполнить все наши краткие руководства и большинство наших учебников на уровне "Бесплатный". Дополнительные сведения см. в статье "Поиск ИИ Azure" бесплатно.
Внимание
Чтобы освободить место для других служб, корпорация Майкрософт может удалить бесплатные службы, которые неактивны в течение длительного периода времени.
Поиск предложения "Поиск по искусственному интеллекту Azure"
Войдите на портал Azure.
В левом верхнем углу панели мониторинга выберите "Создать ресурс".
Используйте поле поиска, чтобы найти поиск по искусственному интеллекту Azure.
Выберите подписку
Если у вас несколько подписок Azure, выберите одну для службы поиска.
Если вы реализуете шифрование , управляемое клиентом, или используете другие функции, использующие удостоверения управляемых служб для доступа к внешним данным, выберите ту же подписку, которую вы используете для Azure Key Vault или других служб, использующих управляемые удостоверения.
Настройка группы ресурсов
Группа ресурсов — это контейнер, содержащий связанные ресурсы для решения Azure. Используйте его для консолидации ресурсов с тем же решением, мониторинга затрат и проверки даты создания службы поиска.
Со временем можно отслеживать текущие и прогнозируемые затраты на отдельные ресурсы и общую группу ресурсов. На следующем снимка экрана показана информация о затратах, доступная при объединении нескольких ресурсов в одну группу:
Присвойте службе имя
Введите имя службы поиска. Имя является частью конечной точки, для которой выдаются вызовы API: https://your-service-name.search.windows.net
Например, при вводе myservice
конечная точка становится https://myservice.search.windows.net
.
При именовании службы следуйте этим правилам:
- Используйте уникальное имя в
search.windows.net
пространстве имен. - Используйте от 2 до 60 символов.
- Используйте только строчные буквы, цифры и дефисы (-).
- Не используйте дефисы в качестве первых двух символов или последнего символа.
- Не используйте последовательные дефисы.
Совет
Если у вас несколько служб поиска, полезно включить регион в имя службы. Например, при выборе способа объединения или присоединения ресурсов имя myservice-westus
может сохранить поездку на страницу свойств.
Выберите регион
Внимание
В связи с высоким спросом поиск Azure AI в настоящее время недоступен для новых экземпляров в некоторых регионах.
Если вы используете несколько служб Azure, поместите их в один регион с минимальными или пустыми платами за пропускную способность. Плата за исходящий трафик данных между службами одного региона не взимается.
В большинстве случаев выберите регион рядом с вами, если ни одно из следующих действий не применяется:
Ближайший регион находится в емкости. Портал Azure имеет преимущество скрытия недоступных регионов и уровней во время настройки ресурсов.
Вы хотите использовать интегрированные блоки данных и векторизацию или встроенные навыки для обогащения ИИ. Интегрированные операции имеют требования к регионам.
Вы хотите использовать служба хранилища Azure для индексирования на основе индексатора или хранить данные приложения, которые не хранятся в индексе. Состояние сеанса отладки, кэши обогащения и хранилища знаний — это функции поиска ИИ Azure, зависящие от служба хранилища Azure. Регион, который вы выбираете для служба хранилища Azure, имеет последствия для безопасности сети. Если вы настраиваете брандмауэр, следует разместить ресурсы в отдельных регионах. Дополнительные сведения см. в разделе "Исходящие подключения" из службы "Поиск ИИ Azure" для служба хранилища Azure.
Контрольный список для выбора региона
Доступен ли поиск по искусственному интеллекту Azure в соседнем регионе? Проверьте список поддерживаемых регионов.
У вас есть определенный уровень? Проверьте доступность региона по уровням.
У вас есть требования к непрерывности бизнес-процессов и аварийному восстановлению (BCDR)? Создайте две или несколько служб поиска в региональных парах в зонах доступности. Например, если вы работаете в Северная Америка, для каждой службы поиска можно выбрать восточную часть США и западную часть США или центрально-северную часть США и южную часть США.
Требуется ли обогащение ИИ, интегрированные блоки данных и векторизация или многомодальный поиск изображений? Поиск ИИ Azure, Azure OpenAI и мультислужба Azure AI должны существовать в одном регионе.
Начните с регионов Azure OpenAI, так как они имеют большую вариативность. Azure OpenAI предоставляет модели внедрения и модели чата для RAG и интегрированной векторизации.
Проверьте регионы поиска ИИ Azure для сопоставления с регионом Azure OpenAI. Если вы используете OCR, распознавание сущностей или другие навыки, поддерживаемые Azure AI, столбец интеграции службы ИИ указывает, находятся ли мультислужбы Azure и поиск ИИ Azure в одном регионе.
Проверьте многомодальные области внедрения для многомодальных API и поиска изображений. Доступ к этому API осуществляется с помощью учетной записи многослужб Azure AI, но в целом она доступна в меньшем количестве регионов, чем в нескольких службах Azure AI.
Регионы с наибольшим перекрытием
В настоящее время следующие регионы предлагают межрегиональную доступность для поиска ИИ Azure, Azure OpenAI и многомодального распознавания ИИ Azure:
- Америка: Западная часть США, восточная часть США
- Европа: Северная Швейцария, Центральная Швеция
Этот список не является окончательным, и в зависимости от уровня может быть больше вариантов. Состояние региона также может быстро измениться, чтобы подтвердить выбор региона перед созданием службы поиска.
Выбор уровня
Поиск по искусственному интеллекту Azure предлагается в нескольких ценовых категориях:
- Free
- Basic
- Standard
- Оптимизированные для операций в хранилище
Каждый уровень имеет собственную емкость и ограничения, а некоторые функции зависят от уровня. Сведения о вычислительных характеристиках, доступности компонентов и доступности регионов см. в разделе "Выбор уровня служб" для поиска ИИ Azure.
Уровни "Базовый" и "Стандартный" являются наиболее распространенными для рабочих нагрузок, но многие клиенты начинаются с уровня "Бесплатный". Оплачиваемые уровни в основном отличаются в размере секции, скорости секции и ограничениях на количество объектов, которые можно создать.
Примечание.
- Вы не можете изменить уровень после создания службы поиска, поэтому тщательно выберите его.
- служба , созданные после 3 апреля 2024 г., имеют более крупные секции и более высокие квоты векторов на каждом оплачиваемом уровне.
Создание службы
После предоставления необходимых входных данных создайте службу поиска.
Служба развертывается в течение нескольких минут, и вы можете отслеживать ход выполнения с помощью уведомлений Azure. Рассмотрите возможность закрепления службы на панели мониторинга для быстрого доступа в будущем.
Настройка проверки подлинности
При создании службы поиска проверка подлинности на основе ключей используется по умолчанию, но это не самый безопасный вариант. Рекомендуется заменить его доступом на основе ролей.
Чтобы включить доступ на основе ролей для службы:
Перейдите в службу поиска в портал Azure.
На левой панели выберите "Ключи> параметров". Вы можете подключиться к службе с помощью ключей API, ролей Azure или обоих. Выберите оба, пока не назначите роли, после чего можно выбрать управление доступом на основе ролей.
Выполните масштабирование службы
После развертывания службы поиска его можно масштабировать в соответствии с вашими потребностями. Поиск по искусственному интеллекту Azure предлагает два измерения масштабирования: реплики и секции. Реплики позволяют службе обрабатывать более высокую нагрузку поисковых запросов, а секции позволяют службе хранить и искать дополнительные документы.
Масштабирование доступно только на платных уровнях. На уровне "Бесплатный" нельзя масштабировать службу или настраивать реплики и секции.
Внимание
Служба должна иметь две реплики для обслуживания только для чтения и записи, а также три реплики для обслуживания чтения и записи.
Добавление ресурсов увеличит ежемесячный счет. Используйте калькулятор цен для понимания последствий выставления счетов. Ресурсы можно настроить на основе нагрузки, например увеличить ресурсы для начального индексирования и уменьшить их позже для добавочного индексирования.
Чтобы масштабировать службу, выполните приведенные действия.
Перейдите в службу поиска в портал Azure.
В левой области выберите "Параметры">
Используйте ползунки для добавления реплик и секций.
Когда следует добавлять вторую службу
Большинство клиентов используют одну службу поиска на уровне достаточной для ожидаемой нагрузки. Одна служба может размещать несколько индексов, каждый из которых изолирован от других, в пределах максимального предела выбранного уровня. В службе "Поиск ИИ Azure" можно направлять запросы только к одному индексу, уменьшая вероятность получения данных из других индексов в той же службе.
Однако для следующих операционных требований может потребоваться вторая служба:
- Непрерывность бизнес-процессов и аварийное восстановление (BCDR). Если произошел сбой, поиск ИИ Azure не обеспечит мгновенной отработки отказа.
- Многотенантные архитектуры , требующие двух или более служб.
- Глобально развернутые приложения, требующие служб в каждой географической области для минимизации задержки.
Примечание.
В службе "Поиск ИИ Azure" нельзя разделять операции индексирования и запроса, поэтому не создавайте несколько служб для отдельных рабочих нагрузок. Индекс всегда запрашивается в службе, в которой она была создана, и вы не можете скопировать индекс в другую службу.
Для обеспечения высокой доступности не требуется вторая служба. Вы обеспечиваете высокий уровень доступности запросов с помощью двух или более реплик в одной службе. Так как реплики обновляются последовательно, по крайней мере одна работает при развернутом обновлении службы. Дополнительные сведения об уровне обслуживания см. в разделе "Соглашения об уровне обслуживания".
Добавление дополнительных служб в подписку
Поиск по искусственному интеллекту Azure ограничивает количество служб поиска, которые можно изначально создать в подписке. Если вы достигнете предела, вы можете запросить дополнительные квоты.
Для запроса квоты подписки необходимо иметь разрешения владельца или участника. В зависимости от емкости региона и центра обработки данных вы можете автоматически запрашивать квоту для добавления служб в подписку. Если запрос завершается сбоем, уменьшите число или отправьте запрос в службу поддержки. Ожидается обходное решение за один месяц для увеличения большой квоты, например более 30 дополнительных служб.
Чтобы запросить дополнительные квоты подписки, выполните следующее:
Перейдите на панель мониторинга в портал Azure.
Используйте поле поиска, чтобы найти службу квот .
На вкладке "Обзор " выберите плитку "Поиск ".
Задайте фильтры для проверки существующей квоты для служб поиска в текущей подписке. Мы рекомендуем фильтровать по использованию.
Рядом с уровнем и регионом, которым требуются дополнительные квоты, выберите "Настройка
запроса".
В новом запросе квоты введите новое ограничение для квоты подписки. Новое ограничение должно быть больше текущего предела. Если региональная емкость ограничена, запрос не будет утвержден автоматически, а отчет об инциденте будет создан от вашего имени для расследования и разрешения.
Отправьте запрос.
Отслеживайте уведомления в портал Azure обновлений по новому ограничению. Большинство запросов утверждены в течение 24 часов.
Следующие шаги
Теперь, когда вы развернули службу поиска, перейдите в портал Azure, чтобы создать первый индекс:
Хотите оптимизировать и сократить ваши расходы на облако?