일괄 유추 및 예측을 위한 모델 배포
이 문서에서는 일괄 처리 유추에 대해 Databricks가 권장하는 사항에 대해 설명합니다.
Azure Databricks에서 실시간 모델 서비스를 위해, Mosaic AI 모델 서빙을 사용하여 모델을 배포하는 방법을 보려면 과을 참조하세요.
일괄 처리 유추를 위한 AI 함수
중요한
이 기능은 공개 미리 보기 상태입니다.
AI 함수는 Databricks에 저장된 데이터에 AI를 적용하는 데 사용할 수 있는 기본 제공 함수입니다.
작업별 AI 함수 또는 범용 기능 ai_query
를 사용하여 일괄 유추를 실행할 수 있습니다. 유연성을 위해 Databricks는 일괄 처리 유추에 ai_query
사용하는 것이 좋습니다.
일괄 처리 유추에 ai_query
사용하는 두 가지 주요 방법이 있습니다.
-
ai_query
및 Databricks에서 호스팅하는 기반 모델을 사용한 일괄 유추. 이 메서드를 사용하는 경우 Databricks는 워크로드에 따라 자동으로 스케일링되는 엔드포인트를 제공하는 모델을 구성합니다. 지원되는 미리 프로비전된 LLM을 확인하십시오. -
구성한 엔드포인트를 제공하는 모델 및
ai_query
사용하여 일괄 처리 유추를. 이 메서드는 Databricks 외부에서 호스트되는 기본 모델, 미세 조정된 기본 모델 또는 기존 ML 모델을 사용하는 일괄 처리 유추 워크플로에 필요합니다. 배포 후ai_query
과 직접 엔드포인트를 사용할 수 있습니다.
Spark DataFrame을 사용하여 일괄 처리 유추
Spark를 사용하여 모델 유추 워크플로에 대한 단계별 가이드는 Spark DataFrame 사용하여 일괄 처리 유추 수행 참조하세요.
딥 러닝 모델 유추 예제는 다음 문서를 참조하세요.
Spark UDF를 사용한 구조적 데이터 추출 및 일괄 처리 유추
다음 예제 Notebook에서는 자동화된 추출 기술을 통해 원시 구조화되지 않은 데이터를 구성되고 사용 가능한 정보로 변환하기 위해 구조화된 데이터 추출을 위한 간단한 에이전트의 개발, 로깅 및 평가를 보여 줍니다. 이 방법은 MLflow의 PythonModel
클래스를 사용하여 일괄 처리 유추를 위한 사용자 지정 에이전트를 구현하고 기록된 에이전트 모델을 Spark User-Defined 함수(UDF)로 사용하는 방법을 보여 줍니다. 이 노트북은 Mosaic AI 에이전트 평가를 활용하여 기준 데이터를 사용해 정확성을 평가하는 방법을 보여줍니다.
Spark UDF를 사용한 구조적 데이터 추출 및 일괄 처리 유추
:::