Azure Databricks에서 DSPy를 사용하여 genAI 앱 빌드
이 문서에서는 DSPy를 설명하고, Azure Databricks에서 DSPy를 활용하여 생성 AI 에이전트를 구축하고 최적화하는 방법을 보여 주는 예제 노트북을 제공합니다.
DSPy란?
DSPy는 생성 AI 에이전트를 프로그래밍 방식으로 정의하고 최적화하기 위한 프레임워크입니다. DSPy는 프롬프트 엔지니어링을 자동화하고 LLM 미세 조정을 오케스트레이션하여 성능을 향상시킬 수 있습니다.
DSPy는 에이전트 개발을 간소화하고 에이전트 품질을 향상시키는 몇 가지 구성 요소로 구성됩니다.
- 모듈: DSPy에서 질문 답변 또는 요약과 같은 특정 텍스트 변환을 처리하는 구성 요소입니다. 기존의 손으로 쓴 프롬프트를 대체하고 예제에서 학습할 수 있으므로 적응성이 향상됩니다.
- 서명: 모듈의 입력 및 출력 동작에 대한 자연어 설명입니다. 예를 들어 "질문 -> 답변"은 모듈이 질문을 입력으로 사용하고 답변을 반환해야 한다고 지정합니다.
- 컴파일러: DSPy의 최적화 도구입니다. 더 나은 프롬프트를 생성하거나 모델을 미세 조정하여 성능 메트릭을 충족하도록 모듈을 조정하여 LM 파이프라인을 개선합니다.
- 프로그램(DSPy): 복잡한 작업을 수행하기 위해 파이프라인에 연결된 모듈 집합입니다. DSPy 프로그램은 유연하므로 컴파일러를 사용하여 최적화하고 적응할 수 있습니다.
텍스트 분류자 DSPy 프로그램 만들기
다음 Notebook에서는 텍스트 분류를 수행하는 DSPy 프로그램을 만드는 방법을 보여 줍니다. 이 예제에서는 DSPy의 작동 방식과 DSPy가 사용하는 구성 요소를 보여 줍니다.
텍스트 분류기 DSPy 프로그램 노트북 만들기
노트북 받기
RAG용 DSPy 프로그램 만들기
이러한 Notebook은 DSPy를 사용하여 기본 RAG 프로그램을 만들고 최적화하는 방법을 보여 줍니다. 이러한 Notebook은 사용자가 서버리스 컴퓨팅을 사용하고 있다고 가정하고, Databricks 런타임 버전과 독립적으로 실행되도록 Notebook 수준에서 패키지를 설치합니다.
1부: RAG DSPy 프로그램 Notebook에 대한 데이터 및 벡터 검색 인덱스 준비
노트북 받기
2부: RAG Notebook용 DSPy 프로그램 만들기 및 최적화
노트북 받기
LangChain을 DSPy로 마이그레이션
이러한 Notebook은 LangChain 모델 코드를 DSPy로 마이그레이션하고 성능을 향상하도록 최적화하는 방법을 보여 줍니다. 이러한 Notebook은 사용자가 서버리스 컴퓨팅을 사용하고 있다고 가정하고, Databricks 런타임 버전과 독립적으로 실행되도록 Notebook 수준에서 패키지를 설치합니다.
LangChain 모델 코드를 DSPy Notebook으로 마이그레이션
노트북 받기
마이그레이션된 DSPy 모델 Notebook 최적화
노트북 받기