Создание векторного индекса

Статья
01/09/2025

В службе "Поиск ИИ Azure" векторное хранилище содержит схему индекса, которая определяет поля векторов и невекторов, векторную конфигурацию алгоритмов, которые создают и сжимают пространство внедрения, а также параметры определений векторных полей, используемых в запросах.

API создания или обновления индекса создает векторное хранилище. Выполните следующие действия, чтобы индексировать векторные данные:

Определение схемы с помощью векторных алгоритмов и необязательного сжатия
Добавление определений полей вектора
Загрузка превекторизованных данных в качестве отдельного шага или использование встроенной векторизации для фрагментирования и кодирования данных во время индексирования

В этой статье объясняется рабочий процесс и используется REST для иллюстрации. После понимания базового рабочего процесса перейдите к примерам кода пакета SDK Azure в репозитории azure-search-vector-samples для использования этих функций в тестовом и рабочем коде.

Совет

Используйте портал Azure для создания векторного индекса и попробуйте интегрировать блоки и векторизацию данных.

Необходимые компоненты

Поиск ИИ Azure в любом регионе и на любом уровне. В службах, созданных до января 2019 года, существует небольшое подмножество, которое не может создать векторный индекс. Если это относится к вам, создайте новую службу для использования векторов. Для индексирования рабочих нагрузок, включающих интегрированную векторизацию (наборы навыков, которые называют Azure AI), поиск ИИ Azure должен находиться в том же регионе, что и службы Azure OpenAI или Azure AI.
Необходимо иметь предварительно существующие векторные внедрения для отправки в индекс или использовать встроенную векторизацию, где модели внедрения вызываются из набора навыков в конвейере индексатора.
Необходимо знать предел измерений модели, используемой для создания внедренных элементов, чтобы можно было назначить это ограничение векторным полем. Встроенная векторизация поддерживает ограниченное число моделей внедрения. Для преобразования текста в ada-002 измерения фиксированы в 1536. Для векторной длины от 1 до 1536 и 3072 векторных значений для текста— 3-маленький или текстовый встраиваемый текст.
Кроме того, следует знать, какую метрику сходства следует использовать. Для внедрения моделей в Azure OpenAI сходство вычисляется с помощью cosine.
Вы должны быть знакомы с созданием индекса. Схема должна содержать поле для ключа документа, другие поля, которые требуется выполнить поиск или фильтрацию, и другие конфигурации для поведения, необходимых во время индексирования и запросов.

Подготовка документов к индексации

Перед индексированием соберите полезные данные документа, включающее поля векторных и невекторных данных. Структура документа должна соответствовать схеме индекса.

Убедитесь, что документы:

Укажите поле или свойство метаданных, которое однозначно идентифицирует каждый документ. Для всех индексов поиска требуется ключ документа. Чтобы удовлетворить требования к ключу документа, исходный документ должен иметь одно поле или свойство, которое может однозначно идентифицировать его в индексе. Это исходное поле должно быть сопоставлено с полем индекса типа Edm.String и key=true в индексе поиска.
Укажите векторные данные (массив чисел с плавающей запятой с одной точностью) в исходных полях.

Векторные поля содержат массив, созданный путем внедрения моделей, по одному внедрению для каждого поля, где поле является полем верхнего уровня (не частью вложенного или сложного типа). Для простейшей интеграции рекомендуется внедрять модели в Azure OpenAI, например модель внедрения текста в текстовые документы или REST API извлечения изображений для изображений.

Если вы можете использовать зависимость от индексаторов и наборов навыков, рекомендуется использовать встроенную векторизацию , которая кодирует изображения и текстовое содержимое во время индексирования. Определения полей предназначены для векторных полей, но входящие исходные данные могут быть текстом или изображениями, которые преобразуются в векторные массивы во время индексирования.
Предоставьте другие поля с содержимым с возможностью чтения для ответа запроса, а также для сценариев гибридного запроса, включающих полнотекстовый поиск или семантический ранжирование в том же запросе.

Индекс поиска должен содержать поля и содержимое для всех сценариев запросов, которые вы хотите поддерживать. Предположим, вы хотите выполнить поиск или фильтрацию по именам продуктов, версиям, метаданным или адресам. В этом случае поиск сходства особенно не полезен. Поиск ключевых слов, гео-поиск или фильтры будут лучшим выбором. Индекс поиска, включающий комплексную коллекцию векторных и невекторных данных, обеспечивает максимальную гибкость для построения запросов и композиции ответов.

Краткий пример полезных данных документов, включающих векторные и невекторные поля, находится в разделе данных вектора нагрузки этой статьи.

Добавление конфигурации векторного поиска

Конфигурация вектора задает параметры, используемые во время индексирования для создания сведений о ближайших соседах между векторными узлами:

Иерархический навигации небольшой мир (HNSW)
Исчерпывающий KNN

Если вы выберете HNSW в поле, вы можете выбрать исчерпывающий KNN во время запроса. Но другое направление не работает: если выбрать исчерпывающий, вы не сможете позже запросить поиск HNSW, так как дополнительные структуры данных, обеспечивающие приблизительный поиск, не существуют.

При необходимости конфигурация вектора также задает методы квантизации для уменьшения размера вектора:

Scalar
Двоичный файл (доступен только в 2024-07-01 и более новых пакетах azure SDK)

Инструкции по переходу на последнюю версию см. в статье об обновлении REST API.

2024-07-01
2024-05-01-preview

Общедоступна версия 2024-07-01 . Он поддерживает векторную конфигурацию:

vectorSearch.algorithms поддержка HNSW и исчерпывающих KNN.
vectorSearch.compressions поддерживает скалярную и двоичную квантизацию, переупачивание и повторную настройку с помощью исходных векторов.
vectorSearch.profiles предоставляет несколько сочетаний конфигураций алгоритма и сжатия.

Убедитесь, что у вас есть стратегия векторизации содержимого. Рекомендуется интегрировать векторизацию и векторизаторы времени запроса для встроенной кодировки.

Используйте API создания или обновления индекса для создания индекса.
vectorSearch Добавьте раздел в индекс, указывающий алгоритмы поиска, используемые для создания пространства внедрения.
```
 "vectorSearch": {
     "compressions": [
         {
             "name": "scalar-quantization",
             "kind": "scalarQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0,
                 "scalarQuantizationParameters": {
                     "quantizedDataType": "int8"
                 }
         },
         {
             "name": "binary-quantization",
             "kind": "binaryQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0,
         }
     ],
     "algorithms": [
         {
             "name": "hnsw-1",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 4,
                 "efConstruction": 400,
                 "efSearch": 500,
                 "metric": "cosine"
             }
         },
         {
             "name": "hnsw-2",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 8,
                 "efConstruction": 800,
                 "efSearch": 800,
                 "metric": "hamming"
             }
         },
         {
             "name": "eknn",
             "kind": "exhaustiveKnn",
             "exhaustiveKnnParameters": {
                 "metric": "euclidean"
             }
         }

     ],
     "profiles": [
       {
         "name": "vector-profile-hnsw-scalar",
         "compression": "scalar-quantization",
         "algorithm": "hnsw-1"
       }
     ]
 }
```
Основные моменты:
- Имена для каждой конфигурации сжатия, алгоритма и профиля должны быть уникальными для его типа в индексе.
- vectorSearch.compressions.kind может иметь значение scalarQuantization или binaryQuantization.
- vectorSearch.compressions.rerankWithOriginalVectors использует исходные несжатые векторы для пересчета сходства и повторного вычисления верхних результатов, возвращаемых первоначальным поисковым запросом. Несжатые векторы существуют в индексе поиска, даже если stored значение false. Это необязательное свойство. Значение по умолчанию — "истина".
- vectorSearch.compressions.defaultOversampling рассматривает более широкий набор потенциальных результатов для смещения сокращения информации от квантизации. Формула для потенциальных результатов состоит из k запроса с чрезмерным умножением. Например, если запрос указывает k значение 5, а превышение составляет 20, запрос фактически запрашивает 100 документов для повторного использования, используя исходный несжатый вектор для этой цели. Возвращаются только самые лучшие k результаты. Это необязательное свойство. Значение по умолчанию — 4.
- Для параметра vectorSearch.compressions.scalarQuantizationParameters.quantizedDataType нужно задать значение int8. Это единственный примитивный тип данных, поддерживаемый в настоящее время. Это необязательное свойство. По умолчанию — int8.
- vectorSearch.algorithms.kind "hnsw" имеют значение или "exhaustiveKnn". Это алгоритмы приблизительных ближайших соседей (ANN), используемые для упорядочивания векторного содержимого во время индексирования.
- vectorSearch.algorithms.m — это число двунаправленных ссылок. Значение по умолчанию — 4. Диапазон составляет от 4 до 10. Более низкие значения должны возвращать меньше шума в результатах.
- vectorSearch.algorithms.efConstruction — это число ближайших соседей, используемых во время индексирования. Значение по умолчанию — 400. Диапазон составляет от 100 до 1000.
- "vectorSearch.algorithms.fSearch — это число ближайших соседей, используемых во время поиска. Значение по умолчанию — 500. Диапазон составляет от 100 до 1000.
- vectorSearch.algorithms.metric если вы используете Azure OpenAI, в противном случае используйте метрику сходства, связанную с используемой моделью внедрения. Поддерживаемые значения: cosine, euclideandotProducthamming (используется для индексирования двоичных данных).
- vectorSearch.profiles добавьте слой абстракции для размещения более богатых определений. Профиль определяется vectorSearchв , а затем ссылается по имени в каждом поле вектора. Это сочетание конфигураций сжатия и алгоритмов. Это свойство, которое вы назначаете вектору, и определяет алгоритм и сжатие полей.

2024-05-01-preview — это последняя предварительная версия.

vectorSearch.algorithms с поддержкой HNSW и исчерпывающим KNN.
vectorSearch.compressions со свойствами скалярной (но не двоичной) квантизации, перезагребания и повторного использования с исходными векторами.
vectorSearch.profiles для нескольких сочетаний конфигураций алгоритма и сжатия.
Включительно 2024-03-01-preview.
Включительно 2023-10-01-preview.
Включительно 2023-11-01 vectorSearch.algorithms и vectorSearch.profiles.

Чтобы создать индекс, используйте REST API создания или обновления индекса предварительной версии.
vectorSearch Добавьте раздел в индекс, указывающий параметры сжатия и алгоритмы поиска, используемые для создания пространства внедрения. Дополнительные сведения см. в разделе "Настройка квантизации векторов".
```
 "vectorSearch": {
     "compressions": [
         {
             "name": "my-scalar-quantization",
             "kind": "scalarQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0,
                 "scalarQuantizationParameters": {
                     "quantizedDataType": "int8"
                 }
         }
     ],
     "algorithms": [
         {
             "name": "hnsw-1",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 4,
                 "efConstruction": 400,
                 "efSearch": 500,
                 "metric": "cosine"
             }
         },
         {
             "name": "hnsw-2",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 8,
                 "efConstruction": 800,
                 "efSearch": 800,
                 "metric": "hamming"
             }
         },
         {
             "name": "eknn",
             "kind": "exhaustiveKnn",
             "exhaustiveKnnParameters": {
                 "metric": "euclidean"
             }
         }

     ],
     "profiles": [
       {
         "name": "vector-profile-hnsw-1",
         "algorithm": "hnsw-1"
       }
     ]
 }
```
Основные моменты:
- Аргумент vectorSearch.compressions.kind должен иметь значение scalarQuantization.
- vectorSearch.compressions.rerankWithOriginalVectors использует исходные несжатые векторы для пересчета сходства и повторного вычисления верхних результатов, возвращаемых первоначальным поисковым запросом. Несжатые векторы существуют в индексе поиска, даже если stored значение false. Это необязательное свойство. Значение по умолчанию — "истина".
- vectorSearch.compressions.defaultOversampling рассматривает более широкий набор потенциальных результатов для смещения сокращения информации от квантизации. Формула для потенциальных результатов состоит из k запроса с чрезмерным умножением. Например, если запрос указывает k значение 5, а превышение составляет 20, запрос фактически запрашивает 100 документов для повторного использования, используя исходный несжатый вектор для этой цели. Возвращаются только самые лучшие k результаты. Это необязательное свойство. Значение по умолчанию — 4.
- Для параметра vectorSearch.compressions.scalarQuantizationParameters.quantizedDataType нужно задать значение int8. Это единственный примитивный тип данных, поддерживаемый в настоящее время. Это необязательное свойство. По умолчанию — int8.
- vectorSearch.algorithms.kind "hnsw" имеют значение или "exhaustiveKnn". Это алгоритмы приблизительных ближайших соседей (ANN), используемые для упорядочивания векторного содержимого во время индексирования.
- vectorSearch.algorithms.m — это число двунаправленных ссылок. Значение по умолчанию — 4. Диапазон составляет от 4 до 10. Более низкие значения должны возвращать меньше шума в результатах.
- vectorSearch.algorithms.efConstruction — это число ближайших соседей, используемых во время индексирования. Значение по умолчанию — 400. Диапазон составляет от 100 до 1000.
- "vectorSearch.algorithms.fSearch — это число ближайших соседей, используемых во время поиска. Значение по умолчанию — 500. Диапазон составляет от 100 до 1000.
- vectorSearch.algorithms.metric если вы используете Azure OpenAI, в противном случае используйте метрику сходства, связанную с используемой моделью внедрения. Поддерживаемые значения: cosine, euclideandotProducthamming (используется для индексирования двоичных данных).
- vectorSearch.profiles добавьте слой абстракции для размещения более богатых определений. Профиль определяется vectorSearchв , а затем ссылается по имени в каждом поле вектора. Это сочетание конфигураций сжатия и алгоритмов. Это свойство, которое вы назначаете вектору, и определяет алгоритм и сжатие полей.

Дополнительные сведения о новых функциях предварительной версии см. в статье "Новые возможности поиска ИИ Azure".

Добавление векторного поля в коллекцию полей

Коллекция полей должна содержать поле для ключа документа, векторных полей и других полей, необходимых для гибридных сценариев поиска.

Поля векторов характеризуются их типом данных, свойством на основе модели внедрения, dimensions используемой для вывода векторов, и профиля вектора.

2024-07-01
2024-05-01-preview

Общедоступна версия 2024-07-01 .

Используйте индекс создания или обновления для создания индекса.
Определите поле вектора со следующими атрибутами. Вы можете сохранить одно созданное внедрение на поле. Для каждого поля вектора:
- typeдолжен быть векторным типом данных. Collection(Edm.Single) является наиболее распространенным для внедрения моделей.
- dimensions — это количество измерений, созданных моделью внедрения. Для преобразования текста в ada-002 исправлено значение 1536. Для ряда моделей внедрения текста-3 существует диапазон значений. Если вы используете встроенную векторизацию и навык внедрения для создания векторов, убедитесь, что это свойство имеет то же значение измерений, которое используется навыком внедрения.
- vectorSearchProfile — это имя профиля, определенного в другом месте индекса.
- searchable должно быть true.
- retrievable может иметь значение true или false. True возвращает необработанные векторы (1536 из них) в виде обычного текста и потребляет место в хранилище. Задайте значение true, если вы передаете результат вектора в нижнее приложение.
- stored может иметь значение true или false. Он определяет, хранится ли дополнительная копия векторов для извлечения. Дополнительные сведения см. в разделе "Уменьшение размера вектора".
- filterable, facetablesortable должен иметь значение false.
Добавьте фильтруемые поля невектора в коллекцию, например "title" с filterable заданным значением true, если требуется вызвать префильтрацию или послефильтрацию в векторном запросе.

Добавьте другие поля, определяющие вещество и структуру индексированного содержимого. Как минимум, вам нужен ключ документа.

Кроме того, следует добавить поля, полезные в запросе или в ответе. В следующем примере показаны векторные поля для заголовка и содержимого ("titleVector", "contentVector"), которые эквивалентны векторам. Он также предоставляет поля для эквивалентного текстового содержимого ("title", "content") полезно для сортировки, фильтрации и чтения в результатах поиска.

В следующем примере показана коллекция полей:

PUT https://my-search-service.search.windows.net/indexes/my-index?api-version=2024-07-01&allowIndexDowntime=true
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "name": "{{index-name}}",
    "fields": [
        {
            "name": "id",
            "type": "Edm.String",
            "key": true,
            "filterable": true
        },
        {
            "name": "title",
            "type": "Edm.String",
            "searchable": true,
            "filterable": true,
            "sortable": true,
            "retrievable": true
        },
        {
            "name": "titleVector",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": true,
            "stored": true,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "content",
            "type": "Edm.String",
            "searchable": true,
            "retrievable": true
        },
        {
            "name": "contentVector",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        }
    ],
    "vectorSearch": {
        "algorithms": [
            {
                "name": "hnsw-1",
                "kind": "hnsw",
                "hnswParameters": {
                    "m": 4,
                    "efConstruction": 400,
                    "efSearch": 500,
                    "metric": "cosine"
                }
            }
        ],
        "profiles": [
            {
                "name": "vector-profile-1",
                "algorithm": "hnsw-1"
            }
        ]
    }
}

Поддерживает все типы векторных данных.
2024-03-01-preview Инклюзивная поддержка индексирования двоичных данных для векторного поиска.

Используйте REST API создания или обновления индекса, чтобы определить коллекцию полей индекса.
Добавьте векторные поля в коллекцию полей. Вы можете сохранить одно созданное внедрение для каждого поля документа. Для каждого поля вектора:
- typeможет быть Collection(Edm.Single), , Collection(Edm.Int16)Collection(Edm.Half)Collection(Edm.SByte)
- dimensions — это количество измерений, созданных моделью внедрения. Для преобразования текста в ada-002 это значение 1536.
- vectorSearchProfile — это имя профиля, определенного в другом месте индекса.
- searchable должно быть true.
- retrievable может иметь значение true или false. True возвращает необработанные векторы (1536 из них) в виде обычного текста и потребляет место в хранилище. Задайте значение true, если вы передаете результат вектора в нижнее приложение. Значение false является обязательным, если stored имеет значение false.
- stored — это новое логическое свойство, которое применяется только к полям векторов. True сохраняет копию векторов, возвращаемых в результатах поиска. False отменяет копирование во время индексирования. Вы можете искать векторы, но не могут возвращать векторы в результатах.
- filterable, facetablesortable должен иметь значение false.
Добавьте фильтруемые поля невектора в коллекцию, например "title" с filterable заданным значением true, если требуется вызвать префильтрацию или послефильтрацию в векторном запросе.
Добавьте другие поля, определяющие вещество и структуру индексированного содержимого. Как минимум, вам нужен ключ документа.

Кроме того, следует добавить поля, полезные в запросе или в ответе. В следующем примере показаны векторные поля для заголовка и содержимого ("titleVector", "contentVector"), которые эквивалентны векторам. Он также предоставляет поля для эквивалентного текстового содержимого ("title", "content") полезно для сортировки, фильтрации и чтения в результатах поиска.

В следующем примере показана коллекция полей:

PUT https://my-search-service.search.windows.net/indexes/my-index?api-version=2024-05-01-preview&allowIndexDowntime=true
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "name": "{{index-name}}",
    "fields": [
        {
            "name": "id",
            "type": "Edm.String",
            "key": true,
            "filterable": true
        },
        {
            "name": "firstVectorfield-float32-embeddings",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "secondVectorfield-float16-embeddings",
            "type": "Collection(Edm.Half)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "thirdVectorfield-int8-embeddings-for-my-custom-quantization-output",
            "type": "Collection(Edm.SByte)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "fourthVectorfield-for-binary-data",
            "type": "Collection(Edm.Byte)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        }
    ],
    "vectorSearch": {
        "algorithms": [
            {
                "name": "hnsw-1",
                "kind": "hnsw",
                "hnswParameters": {
                    "m": 4,
                    "efConstruction": 400,
                    "efSearch": 500,
                    "metric": "cosine"
                }
            }
        ],
        "profiles": [
            {
                "name": "vector-profile-1",
                "algorithm": "hnsw-1"
            }
        ]
    }
}

Загрузка векторных данных для индексирования

Содержимое, предоставленное для индексирования, должно соответствовать схеме индекса и включать уникальное строковое значение ключа документа. Превекторные данные загружаются в одно или несколько векторных полей, которые могут сосуществовать с другими полями, содержащими содержимое невектора.

Для приема данных можно использовать методы принудительной отправки или извлечения.

Push API
API извлечения (индексаторы)

Использование документов — индекс для загрузки векторных и невекторных данных в индекс. API push-уведомлений для индексирования идентичны во всех стабильных и предварительных версиях. Используйте любой из следующих API для загрузки документов:

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/index?api-version=2024-07-01

{
    "value": [
        {
            "id": "1",
            "title": "Azure App Service",
            "content": "Azure App Service is a fully managed platform for building, deploying, and scaling web apps. You can host web apps, mobile app backends, and RESTful APIs. It supports a variety of programming languages and frameworks, such as .NET, Java, Node.js, Python, and PHP. The service offers built-in auto-scaling and load balancing capabilities. It also provides integration with other Azure services, such as Azure DevOps, GitHub, and Bitbucket.",
            "category": "Web",
            "titleVector": [
                -0.02250031754374504,
                 . . . 
                        ],
            "contentVector": [
                -0.024740582332015038,
                 . . .
            ],
            "@search.action": "upload"
        },
        {
            "id": "2",
            "title": "Azure Functions",
            "content": "Azure Functions is a serverless compute service that enables you to run code on-demand without having to manage infrastructure. It allows you to build and deploy event-driven applications that automatically scale with your workload. Functions support various languages, including C#, F#, Node.js, Python, and Java. It offers a variety of triggers and bindings to integrate with other Azure services and external services. You only pay for the compute time you consume.",
            "category": "Compute",
            "titleVector": [
                -0.020159931853413582,
                . . .
            ],
            "contentVector": [
                -0.02780858241021633,
                 . . .
            ],
            "@search.action": "upload"
        }
        . . .
    ]
}

API извлечения относятся к индексаторам, которые автоматизируют несколько шагов индексирования, от извлечения и обновления данных до интегрированной векторизации , кодируемой содержимым для поиска векторов.

Источники данных должны быть поддерживаемым типом.
Наборы навыков предоставляют навык разделения текста для фрагментирования данных, а также навыки, которые подключаются к моделям внедрения. Некоторые из них являются общедоступными, другие все еще находятся в предварительной версии. Навыки и векторизаторы используются для создания внедрения. Навык, который вы выбираете для индексирования, должен быть связан с эквивалентным векторизатором для запросов. Для векторизации во время индексирования выберите из следующих навыков:
- Навык azureOpenAIEmbedding
- Навык пользовательского веб-API
- Навыки многомодального внедрения в azure AI Vision (предварительная версия)
- Навык AML (предварительная версия) для создания внедрения моделей, размещенных в каталоге моделей Azure AI Foundry. Дополнительные сведения см. в статье о реализации интегрированной векторизации с помощью моделей из Azure AI Foundry .
Индексы предоставляют определения векторных полей и конфигурации векторного поиска. Эти определения описаны в этой статье.
Индексаторы управляют конвейером индексирования. Дополнительные сведения см. в разделе "Создание индексатора".

Если вы знакомы с индексаторами и наборами навыков:

Сопоставления полей, сопоставления выходных полей и параметры обнаружения удаления применяются к полям вектора и невектора одинаково.
Если векторные данные источникируются в файлах, рекомендуется недедефакторparsingMode, например jsonjsonLines, или csv на основе формы данных.
Для источников данных индексаторы BLOB-объектов Azure и Azure Cosmos DB для индексаторов NoSQL с одним из упомянутых выше анализаторов были протестированы и подтверждены для работы.
Размеры всех векторов из источника данных должны совпадать и совпадать с их определением индекса для поля, с который они сопоставляются. Индексатор создает ошибку для любых документов, которые не соответствуют.

Проверьте индекс для векторного содержимого

Для проверки можно запросить индекс с помощью обозревателя поиска в портал Azure или вызове REST API. Так как поиск по искусственному интеллекту Azure не может преобразовать вектор в удобочитаемый пользователем текст, попробуйте вернуть поля из того же документа, который предоставляет доказательства соответствия. Например, если векторный запрос предназначен для поля titleVector, можно выбрать "title" для результатов поиска.

Поля должны быть указаны как "извлекаемые" для включения в результаты.

Портал Azure
REST API

Просмотрите индексы в индексах управления>поиском, чтобы просмотреть размер индекса всех и векторных индексов. Положительный размер индекса вектора указывает на наличие векторов.
Используйте обозреватель поиска для запроса индекса. Обозреватель поиска имеет два представления: представление запросов (по умолчанию) и представление JSON.
- Задайте параметры>запроса Скрыть векторные значения в результатах поиска для получения более доступных для чтения результатов.
- Используйте представление JSON для векторных запросов. Вы можете вставить определение JSON векторного запроса, который требуется выполнить, или использовать встроенное преобразование текста в вектор или изображения в вектор, если индекс имеет назначение векторизатора. Дополнительные сведения о поиске изображений см . в кратком руководстве. Поиск изображений в обозревателе поиска.
- Используйте представление запроса по умолчанию для быстрого подтверждения того, что индекс содержит векторы. Представление запроса предназначено для полнотекстового поиска. Хотя его нельзя использовать для векторных запросов, можно отправить пустой поиск (search=*) для проверки содержимого. Содержимое всех полей, включая векторные поля, возвращается в виде обычного текста.
- Дополнительные сведения см. в статье "Создание векторного запроса ".

Следующий пример REST API — это векторный запрос, но возвращает только невекторные поля (заголовок, содержимое, категория). В результатах поиска можно возвращать только поля, помеченные как "извлекаемые".

POST https://my-search-service.search.windows.net/indexes/my-index/docs/search?api-version=2024-07-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vector": {
        "value": [
            -0.009154141,
            0.018708462,
            . . . 
            -0.02178128,
            -0.00086512347
        ],
        "fields": "contentVector",
        "k": 5
    },
    "select": "title, content, category"
}

Обновление хранилища векторов

Чтобы обновить векторное хранилище, измените схему и при необходимости перезагрузите документы, чтобы заполнить новые поля. API для обновлений схемы включают создание или обновление индекса (REST), CreateOrUpdateIndex в пакете SDK azure для .NET, create_or_update_index в пакете SDK Azure для Python и аналогичных методах в других пакетах SDK Azure.

Стандартное руководство по обновлению индекса рассматривается в разделе "Обновление" или перестроение индекса.

Ключевые моменты:

Удаление и перестроение часто требуется для обновлений и удаления существующих полей.
Однако можно обновить существующую схему со следующими изменениями без необходимости перестроения:
- Добавление новых полей в коллекцию полей.
- Добавьте новые конфигурации векторов, назначенные новым полям, но не существующим полям, которые уже векторизированы.
- Измените значение "извлекаемое" (значения имеют значение true или false) в существующем поле. Поля векторов должны быть доступны для поиска и извлечения, но если вы хотите отключить доступ к полю вектора в ситуациях, когда удаление и перестроение невозможно, можно задать значение false.

Следующие шаги

На следующем шаге мы рекомендуем запрашивать векторные данные в индексе поиска.

Примеры кода в репозитории azure-search-vector демонстрируют сквозные рабочие процессы, включающие определение схемы, векторизацию, индексирование и запросы.

Существует демонстрационный код для Python, C# и JavaScript.

Поделиться через