Добавление собственного источника данных
Добавление данных выполняется с помощью Azure AI Studio, на игровой площадке чата или путем указания источника данных в вызове API. Добавленный источник данных затем используется для расширения запроса, отправленного в модель. При настройке данных в студии можно отправить файлы данных, использовать данные в учетной записи хранения BLOB-объектов или подключиться к существующему индексу поиска ИИ.
Если вы загружаете или используете файлы, уже размещенные в учетной записи хранения, Azure OpenAI .md
поддерживает файлы , .html
.txt
.pdf
и Microsoft Word или PowerPoint. Если любой из этих файлов содержит графику или изображения, качество отклика зависит от того, насколько хорошо можно извлечь текст из визуального содержимого.
При отправке данных или подключении к файлам в учетной записи хранения рекомендуется использовать Azure AI Studio для создания ресурса поиска и индекса. Добавление данных таким образом позволяет выполнить соответствующее фрагментирование при вставке в индекс, что дает лучшие ответы. Если вы используете большие текстовые файлы или формы, следует использовать доступный сценарий подготовки данных для повышения точности модели ИИ.
Включение семантического поиска для ИИ служба может улучшить результат поиска индекса данных, и вы, скорее всего, получите более качественные ответы и ссылки. Однако включение семантического поиска может увеличить стоимость службы поиска.
Вы также можете использовать мастер в ресурсе поиска ИИ для векторизации данных соответствующим образом, которые вы узнаете в упражнении этого модуля. Это делает несколько дополнительных шагов по сравнению с этим в AI Studio, однако служит хорошим примером использования шаблона RAG с существующим набором данных.
Подключите свои данные
Чтобы подключить данные, перейдите на площадку чата в Azure AI Studio и выберите вкладку "Добавить данные". Нажмите кнопку "Добавить источник данных", чтобы подключить данные. В этом руководстве показано, как настроить подключение к каждому источнику данных и получить эти данные в индекс поиска.
Совет
Если вы используете мастер в AI Studio для создания и подключения источника данных, вам потребуется создать концентратор и проект, который не рассматривается здесь. В ai Studio вы узнаете об этом или обратитесь к документации по AI Studio.
Если вы используете собственный индекс, который не был создан с помощью Azure AI Studio, одна из страниц позволяет указать сопоставление столбцов. Важно предоставить точные поля, чтобы обеспечить модель более эффективной реакции, особенно для данных содержимого.