Управление емкостью

Завершено

Чтобы создать решение поиска ИИ Azure, необходимо создать ресурс службы "Поиск ИИ Azure" в подписке Azure. В зависимости от того, какое решение вы создаете, вам также могут потребоваться ресурсы Azure для хранения данных и других служб приложений.

Уровни служб и управление емкостью

При создании ресурса поиска ИИ Azure необходимо указать ценовую категорию. Выбранная ценовая категория определяет ограничения емкости для службы поиска и доступные параметры конфигурации, а также стоимость службы. Доступны следующие ценовые категории.

  • Бесплатный (F). Этот уровень предназначен для знакомства со службой или работы с примерами в учебниках в документации по продукту.
  • Базовый (B): используйте этот уровень для небольших решений поиска, которые включают не более 15 индексов и 5 ГБ данных индекса.
  • Стандартный (S). Используется для решений корпоративного уровня. Этот уровень имеет несколько вариантов, включая S, S2 и S3 (увеличенная емкость для индексов и хранилища), а также S3HD (с оптимизацией для ускорения операций чтения при работе с меньшим количеством индексов).
  • Оптимизированный для хранилища (L). Также имеет варианты (L1 или L2) и используется для создания крупных индексов, в которых допустимо определенное увеличение задержки при обработке запросов.

Примечание.

Важно выбрать наиболее подходящую ценовую категорию для решения, поскольку впоследствии ее нельзя изменить. Если вы обнаружите, что выбранная ценовая категория больше не подходит для вашего решения, необходимо создать новый ресурс поиска ИИ Azure и повторно создать все индексы и объекты.

Реплики и секции

В зависимости от выбранной ценовой категории вы можете оптимизировать решение для обеспечения необходимого уровня масштабируемости и доступности, создавая реплики и секции.

  • Реплики — это экземпляры службы поиска, которые можно рассматривать как узлы в кластере. Увеличение количества реплик позволяет обеспечить достаточную емкость для обслуживания нескольких параллельных запросов при управлении текущими операциями индексирования.

  • Секции используются для разделения индекса на несколько расположений хранения, что позволяет разбивать операции ввода-вывода, такие как запросы или перестроение индекса.

Настраиваемое сочетание реплик и секций определяет используемые решением единицы поиска. Проще говоря, количество единиц поиска определяется как произведение количества реплик и количества секций (Р x С = ЕП). Например, ресурс с 4 репликами и 3 секциями использует 12 единиц поиска.

Совет

Дополнительные сведения о ценовых категориях и управлении емкостью см. в документации по поиску ИИ Azure.