Stap 1. Codeopslagplaats klonen en compute maken
Zie de GitHub-opslagplaats voor de voorbeeldcode in deze sectie. U kunt de opslagplaatscode ook gebruiken als sjabloon waarmee u uw eigen AI-toepassingen kunt maken.
Volg deze stappen om de voorbeeldcode te laden in uw Databricks-werkruimte en de globale instellingen voor de toepassing te configureren.
Vereisten
- Een Azure Databricks-werkruimte met serverloze compute en Unity Catalog ingeschakeld.
- Een bestaand Mozaïek AI Vector Search-eindpunt of machtigingen voor het maken van een nieuw Vector Search-eindpunt (in dit geval maakt het installatienotebook er een voor u).
- Schrijf toegang tot een bestaand Unity Catalog-schema waarin de uitvoer-Delta-tabellen met de geparseerde en gesegmenteerde documenten en Vector Search-indexen worden opgeslagen, of machtigingen voor het maken van een nieuwe catalogus en schema (in dit geval wordt er een voor u gemaakt).
- Eén gebruikerscluster met DBR 14.3 of hoger dat toegang heeft tot internet. Internettoegang is vereist om de benodigde Python- en systeempakketten te downloaden. Gebruik geen cluster waarop Databricks Runtime voor Machine Learning wordt uitgevoerd, omdat deze zelfstudies Python-pakketconflicten hebben met Databricks Runtime ML.
Stroomdiagram voor zelfstudie
In het diagram ziet u de stroom van stappen die in deze zelfstudie worden gebruikt.
Instructies
Kloon deze opslagplaats in uw werkruimte met behulp van Git-mappen.
Open het notitieblok rag_app_sample_code/00_global_config en pas de instellingen daar aan.
# The name of the RAG application. This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes RAG_APP_NAME = 'my_agent_app' # Unity Catalog catalog and schema where outputs tables and indexes are saved # If this catalog/schema does not exist, you need create catalog/schema permissions. UC_CATALOG = f'{user_name}_catalog' UC_SCHEMA = f'rag_{user_name}' ## Name of model in Unity Catalog where the POC chain is logged UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}" # Vector Search endpoint where index is loaded # If this does not exist, it will be created VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search' # Source location for documents # You need to create this location and add files SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
Open het 01_validate_config_and_create_resources notebook en voer deze uit.
Volgende stap
Ga door met de implementatie van POC.
Volgende: Stap 2. POC implementeren en feedback verzamelen >