Шаг 1. Клонирование репозитория кода и создание вычислительных ресурсов
См. репозиторий GitHub для примера кода в этом разделе. Вы также можете использовать код репозитория в качестве шаблона, с помощью которого можно создавать собственные приложения ИИ.
Выполните следующие действия, чтобы загрузить пример кода в рабочую область Databricks и настроить глобальные параметры для приложения.
Требования
- Рабочая область Azure Databricks с поддержкой бессерверных вычислений и каталога Unity.
- Существующая конечная точка поиска вектора вектора мозаики или разрешения для создания новой конечной точки векторного поиска векторов (записная книжка установки создает ее для вас в данном случае).
- Запись доступа к существующей схеме каталога Unity, в которой хранятся выходные таблицы Delta, включающие синтаксический анализ и блокированные документы и индексы векторного поиска, или разрешения на создание нового каталога и схемы (записная книжка установки создает ее для вас в этом случае).
- Единый кластер пользователей под управлением DBR 14.3 или более поздней версии, имеющий доступ к Интернету. Для скачивания необходимых пакетов Python и системного доступа к Интернету требуется доступ к Интернету. Не используйте кластер под управлением Databricks Runtime для Машинное обучение, так как в этих руководствах пакет Python конфликтует с Databricks Runtime ML.
Схема потока учебника
На схеме показан поток шагов, используемых в этом руководстве.
Instructions
Клонируйте этот репозиторий в рабочую область с помощью папок Git.
Откройте записную книжку rag_app_sample_code/00_global_config и измените параметры.
# The name of the RAG application. This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes RAG_APP_NAME = 'my_agent_app' # Unity Catalog catalog and schema where outputs tables and indexes are saved # If this catalog/schema does not exist, you need create catalog/schema permissions. UC_CATALOG = f'{user_name}_catalog' UC_SCHEMA = f'rag_{user_name}' ## Name of model in Unity Catalog where the POC chain is logged UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}" # Vector Search endpoint where index is loaded # If this does not exist, it will be created VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search' # Source location for documents # You need to create this location and add files SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
Откройте и запустите записную книжку 01_validate_config_and_create_resources.
Следующий шаг
Продолжайте развертывание POC.