Databricks의 LLM(대규모 언어 모델)
Azure Databricks를 사용하면 공개적으로 사용 가능한 대규모 언어 모델에 쉽게 액세스하고 빌드할 수 있습니다.
Machine Learning용 Databricks 런타임에는 미리 학습된 기존 모델 또는 기타 오픈 소스 라이브러리를 워크플로에 통합할 수 있는 Hugging Face Transformers 및 LangChain과 같은 라이브러리가 포함되어 있습니다. 여기에서 Azure Databricks 플랫폼 기능을 활용하여 도메인 성능을 향상하기 위해 사용자 고유의 데이터를 사용하여 LLM을 미세 조정할 수 있습니다.
또한 Azure Databricks는 SQL 사용자가 AI 함수를 사용하여 Azure OpenAI 및 OpenAI와 같은 LLM에 액세스하고 실험할 수 있는 기본 제공 기능을 제공합니다.
파운데이션 모델 미세 조정
Important
이 기능은 공개 미리 보기 상태입니다. 공개 미리 보기에 등록하려면 Databricks 계정 팀에 문의하세요.
기본 모델 미세 조정(현재 Mosaic AI 모델 학습의 일부임)은 전체 모델 미세 조정을 수행하기 위해 Databricks 학습 스택에 대한 간단한 인터페이스입니다.
파운데이션 모델 미세 조정을 사용하여 다음을 수행할 수 있습니다.
- MLflow에 저장된 검사점을 사용하여 사용자 지정 데이터로 모델을 미세 조정합니다. 미세 조정된 모델의 완전한 제어를 유지합니다.
- 모델을 Unity Catalog에 자동으로 등록하여 모델 서비스로 쉽게 배포할 수 있습니다.
- 이전에 미세 조정된 모델의 가중치를 로드하여 완성된 독점 모델을 미세 조정합니다.
파운데이션 모델 미세 조정을 참조 하세요.
Hugging Face 변환기
Databricks에서 Face Transformers를 포옹하면 NLP(자연어 처리) 일괄 처리 애플리케이션을 확장하고 대문자 모델 애플리케이션에 대한 모델을 미세 조정할 수 있습니다.
Hugging Face transformers
라이브러리는 Databricks Runtime 10.4 LTS ML 이상에 미리 설치되어 있습니다. 많은 인기 있는 NLP 모델은 GPU 하드웨어에서 가장 잘 작동하므로 CPU에서 사용하도록 특별히 최적화된 모델을 사용하지 않는 한 최근 GPU 하드웨어를 사용하여 최상의 성능을 얻을 수 있습니다.
DSPy
DSPy는 사용자 정의 자연어 서명을 완전한 지침 및 몇 가지 예제로 변환하여 프롬프트 튜닝을 자동화합니다.
DSPy를 사용하는 방법에 대한 예제는 Azure Databricks에서 DSPy를 사용하여 genAI 앱 빌드를 참조하세요.
LangChain
LangChain은 LangChain 고객이 Azure Databricks 환경에서 직접 MLflow의 강력한 도구 및 실험 추적 기능을 활용할 수 있도록 하는 실험적 MLflow 버전으로 제공됩니다.
LangChain은 LLM(대규모 언어 모델)을 활용하는 애플리케이션을 만들고 외부 데이터와 결합하여 LLM에 대한 더 많은 학습 컨텍스트를 제공하는 데 도움이 되도록 설계된 소프트웨어 프레임워크입니다.
Databricks Runtime ML은 Databricks Runtime 13.1 ML 이상에 포함됩니다 langchain
.
Databricks 특정 LangChain 통합에 대해 알아봅니다.
AI 함수
Important
이 기능은 공개 미리 보기 상태입니다.
AI 함수는 SQL 사용자가 다음을 수행할 수 있도록 하는 기본 제공 SQL 함수입니다.
- Databricks Foundation 모델 API를 사용하여 회사의 데이터에 대한 다양한 작업을 완료합니다.
- OpenAI에서 GPT-4와 같은 외부 모델에 액세스하고 실험합니다.
- Mosaic AI 모델에서 호스트하는 쿼리 모델은 SQL 쿼리에서 엔드포인트를 제공합니다.