1단계. 코드 리포지토리 복제 및 컴퓨팅 만들기
이 섹션의 샘플 코드는 GitHub 리포지토리에서 확인하세요. 리포지토리 코드를 사용자 고유의 AI 애플리케이션을 만드는 템플릿으로 사용할 수도 있습니다.
다음 단계에 따라 Databricks 작업 영역에 샘플 코드를 로드하고 애플리케이션에 대한 전역 설정을 구성합니다.
요구 사항
- 서버리스 컴퓨팅 및 Unity 카탈로그를 사용하도록 설정된 Azure Databricks 작업 영역.
- 기존 Mosaic AI 벡터 검색 엔드포인트 또는 새 벡터 검색 엔드포인트 를 만들 수 있는 권한(이 경우 설치 전자 필기장이 자동으로 만들어집니다).
- 구문 분석된 문서와 청크 분할된 문서 및 벡터 검색 인덱스를 포함하는 출력 델타 테이블이 저장되는 기존 Unity 카탈로그 스키마에 대한 쓰기 액세스 권한 또는 새 카탈로그 및 스키마를 만들 수 있는 권한(이 경우 설치 Notebook은 사용자를 위해 만듭니다).
- 인터넷에 액세스할 수 있는 DBR 14.3 이상을 실행하는 단일 사용자 클러스터입니다. 필요한 Python 및 시스템 패키지를 다운로드하려면 인터넷 액세스가 필요합니다. 이러한 자습서에서는 Databricks Runtime ML과 Python 패키지가 충돌하므로 Machine Learning용 Databricks 런타임을 실행하는 클러스터를 사용하지 마세요.
자습서 흐름 다이어그램
다이어그램은 이 자습서에 사용된 단계의 흐름을 보여줍니다.
지침
Git 폴더를 사용하여 이 리포지토리를 작업 영역에 복제합니다.
rag_app_sample_code/00_global_config 전자 필기장을 열고 설정을 조정합니다.
# The name of the RAG application. This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes RAG_APP_NAME = 'my_agent_app' # Unity Catalog catalog and schema where outputs tables and indexes are saved # If this catalog/schema does not exist, you need create catalog/schema permissions. UC_CATALOG = f'{user_name}_catalog' UC_SCHEMA = f'rag_{user_name}' ## Name of model in Unity Catalog where the POC chain is logged UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}" # Vector Search endpoint where index is loaded # If this does not exist, it will be created VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search' # Source location for documents # You need to create this location and add files SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
01_validate_config_and_create_resources Notebook을 열고 실행합니다.
다음 단계
POC 배포를 계속합니다.