Dela via


Steg 1. Klona kodlagringsplatsen och skapa beräkning

arbetsflöde för utvärderingsdriven utveckling

Se GitHub-lagringsplatsen för exempelkoden i det här avsnittet. Du kan också använda lagringsplatskoden som en mall för att skapa dina egna AI-program.

Följ de här stegen för att läsa in exempelkoden till din Databricks-arbetsyta och konfigurera de globala inställningarna för programmet.

Krav

  • En Azure Databricks-arbetsyta med serverlös beräkning och Unity Catalog aktiverad.
  • En befintlig slutpunkt för Mosaic AI Vector Search eller behörigheter för att skapa en ny slutpunkt för vektorsökning (installationsanteckningsboken skapar en åt dig i det här fallet).
  • Skrivåtkomst till ett befintligt Unity Catalog-schema där Delta-utdatatabellerna som innehåller de tolkade och segmenterade dokumenten och Vector Search-index lagras, eller behörigheter för att skapa en ny katalog och ett nytt schema (installationsanteckningsboken skapar en åt dig i det här fallet).
  • Ett kluster med en användare som kör DBR 14.3 eller senare och som har åtkomst till Internet. Internetåtkomst krävs för att ladda ned nödvändiga Python- och systempaket. Använd inte ett kluster som kör Databricks Runtime för Machine Learning eftersom python-paket står i konflikt med Databricks Runtime ML.

Flödesdiagram för självstudie

Diagrammet visar flödet av steg som används i den här självstudien.

flödet av notebook-filer som används i självstudien

Instruktioner

  1. Klona den här lagringsplatsen till din arbetsyta med hjälp av Git-mappar.

    video om hur du skapar en git-mapp

  2. Öppna anteckningsboken rag_app_sample_code/00_global_config och justera inställningarna där.

    # The name of the RAG application.  This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes
    RAG_APP_NAME = 'my_agent_app'
    
    # Unity Catalog catalog and schema where outputs tables and indexes are saved
    # If this catalog/schema does not exist, you need create catalog/schema permissions.
    UC_CATALOG = f'{user_name}_catalog'
    UC_SCHEMA = f'rag_{user_name}'
    
    ## Name of model in Unity Catalog where the POC chain is logged
    UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}"
    
    # Vector Search endpoint where index is loaded
    # If this does not exist, it will be created
    VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search'
    
    # Source location for documents
    # You need to create this location and add files
    SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
    
  3. Öppna och kör den 01_validate_config_and_create_resources notebook-filen.

Gå vidare

Fortsätt med Distribuera POC.

< Föregående: Förutsättningar

Nästa: Steg 2. Distribuera POC och samla in feedback >