Databricks 기능 서비스란?
Databricks 기능 제공 기능을 사용하면 Azure Databricks 외부에 배포된 모델 또는 애플리케이션에서 Databricks 플랫폼의 데이터를 사용할 수 있습니다. 기능 서비스 엔드포인트는 자동으로 크기가 조정되어 실시간 트래픽에 맞게 조정되고 기능을 제공하기 위한 고가용성 대기 시간이 짧은 서비스를 제공합니다. 이 페이지에서는 기능 제공을 설정하고 사용하는 방법을 설명합니다. 단계별 자습서는 엔드포인트를 제공하는 기능 배포 및 쿼리를 참조하세요.
Mosaic AI Model Serving를 사용하여 Databricks의 기능을 사용하여 빌드된 모델을 제공하는 경우 모델은 자동으로 유추 요청에 대한 기능을 조회하고 변환합니다. Databricks 기능 제공을 사용하면 RAG(검색 보강 세대) 애플리케이션뿐만 아니라 Databricks 외부에서 제공되는 모델 또는 Unity 카탈로그의 데이터를 기반으로 하는 기능이 필요한 다른 애플리케이션과 같은 다른 애플리케이션에 필요한 기능을 위해 구조화된 데이터를 제공할 수 있습니다.
기능 제공을 사용하는 이유는 무엇인가요?
Databricks 기능 제공은 미리 구체화된 주문형 기능을 제공하는 단일 인터페이스를 제공합니다. 또한 다음과 같은 혜택이 포함됩니다.
- 단순성입니다. Databricks는 인프라를 처리합니다. 단일 API 호출을 통해 Databricks는 프로덕션 준비 서비스 환경을 만듭니다.
- 고가용성 및 확장성. 기능 서비스 엔드포인트는 자동으로 확장 및 축소되어 서비스 요청 볼륨에 맞게 조정됩니다.
- 보안. 엔드포인트는 보안 네트워크 경계에 배포되며 엔드포인트가 삭제되거나 0으로 확장될 때 종료되는 전용 컴퓨팅을 사용합니다.
요구 사항
- Databricks Runtime 14.2 ML 이상
- Python API를 사용하려면 기능 제공에 Databricks Runtime 14.2 ML에 기본 제공되는
databricks-feature-engineering
버전 0.1.2 이상이 필요합니다. 이전 Databricks Runtime ML 버전의 경우%pip install databricks-feature-engineering>=0.1.2
을 사용하여 수동으로 필수 버전을 설치해야 합니다. Databricks Notebook을 사용하는 경우 새 셀dbutils.library.restartPython()
에서 이 명령을 실행하여 Python 커널을 다시 시작해야 합니다. - Databricks SDK를 사용하려면 기능 제공에
databricks-sdk
버전 0.18.0 이상이 필요합니다. 필요한 버전을 수동으로 설치하려면%pip install databricks-sdk>=0.18.0
를 사용합니다. Databricks Notebook을 사용하는 경우 새 셀dbutils.library.restartPython()
에서 이 명령을 실행하여 Python 커널을 다시 시작해야 합니다.
Databricks 기능 제공은 엔드포인트 만들기, 업데이트, 쿼리 및 삭제를 위한 UI 및 여러 프로그래밍 옵션을 제공합니다. 이 문서에는 다음 각 옵션에 대한 지침이 포함되어 있습니다.
- Databricks UI
- REST API
- Python API
- Databricks SDK
REST API 또는 MLflow 배포 SDK를 사용하려면 Databricks API 토큰이 있어야 합니다.
Important
프로덕션 시나리오에 대한 보안 모범 사례로 Databricks는 프로덕션 중에 인증을 위해 컴퓨터-컴퓨터 OAuth 토큰을 사용하는 것이 좋습니다.
테스트 및 개발을 위해 Databricks는 작업 영역 사용자 대신 서비스 주체에 속하는 개인용 액세스 토큰을 사용하는 것이 좋습니다. 서비스 주체에 대한 토큰을 만들려면 서비스 주체에 대한 토큰 관리를 참조하세요.
기능 제공에 대한 인증
인증에 대한 자세한 내용은 Azure Databricks 리소스에 대한 액세스 인증을 참조하세요.
인증 요청을 처리하는 데 사용하는 FeatureSpec
FeatureSpec
는 사용자 정의 기능 및 함수 집합입니다.
FeatureSpec
에서 기능과 함수를 결합할 수 있습니다.
FeatureSpecs
는 Unity 카탈로그에 저장되고 관리되며 카탈로그 탐색기에 표시됩니다.
FeatureSpec
에 지정된 테이블은 온라인 테이블 또는 타사 온라인 저장소에 게시해야 합니다.
실시간 기능 서비스 또는 타사 온라인 상점에 대한 온라인 테이블 사용을 참조하세요.
databricks-feature-engineering
패키지를 사용하여 FeatureSpec
를 만들어야 합니다.
from databricks.feature_engineering import (
FeatureFunction,
FeatureLookup,
FeatureEngineeringClient,
)
fe = FeatureEngineeringClient()
features = [
# Lookup column `average_yearly_spend` and `country` from a table in UC by the input `user_id`.
FeatureLookup(
table_name="main.default.customer_profile",
lookup_key="user_id",
feature_names=["average_yearly_spend", "country"]
),
# Calculate a new feature called `spending_gap` - the difference between `ytd_spend` and `average_yearly_spend`.
FeatureFunction(
udf_name="main.default.difference",
output_name="spending_gap",
# Bind the function parameter with input from other features or from request.
# The function calculates a - b.
input_bindings={"a": "ytd_spend", "b": "average_yearly_spend"},
),
]
# Create a `FeatureSpec` with the features defined above.
# The `FeatureSpec` can be accessed in Unity Catalog as a function.
fe.create_feature_spec(
name="main.default.customer_features",
features=features,
)
엔드포인트 만들기
FeatureSpec
은 엔드포인트를 정의합니다. 자세한 내용은 사용자 지정 모델 제공 엔드포인트 만들기, Python API 설명서 또는 Databricks SDK 설명서를 참조하세요.
참고 항목
대기 시간이 중요하거나 초당 높은 쿼리가 필요한 워크로드의 경우 Model Serving는 엔드포인트를 제공하는 사용자 지정 모델에 대한 경로 최적화를 제공합니다. 엔드포인트 제공 시 경로 최적화 구성을 참조하세요.
REST API
curl -X POST -u token:$DATABRICKS_API_TOKEN ${WORKSPACE_URL}/api/2.0/serving-endpoints \
-H 'Content-Type: application/json' \
-d '"name": "customer-features",
"config": {
"served_entities": [
{
"entity_name": "main.default.customer_features",
"workload_size": "Small",
"scale_to_zero_enabled": true
}
]
}'
Databricks SDK - Python
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.serving import EndpointCoreConfigInput, ServedEntityInput
workspace = WorkspaceClient()
# Create endpoint
workspace.serving_endpoints.create(
name="my-serving-endpoint",
config = EndpointCoreConfigInput(
served_entities=[
ServedEntityInput(
entity_name="main.default.customer_features",
scale_to_zero_enabled=True,
workload_size="Small"
)
]
)
)
Python API
from databricks.feature_engineering.entities.feature_serving_endpoint import (
ServedEntity,
EndpointCoreConfig,
)
fe.create_feature_serving_endpoint(
name="customer-features",
config=EndpointCoreConfig(
served_entities=ServedEntity(
feature_spec_name="main.default.customer_features",
workload_size="Small",
scale_to_zero_enabled=True,
instance_profile_arn=None,
)
)
)
엔드포인트를 보려면 Databricks UI의 왼쪽 사이드바에서 서비스를 클릭합니다. 상태가 준비 상태이면 엔드포인트가 쿼리에 응답할 준비가 된 것입니다. Mosaic AI 모델 제공에 대한 자세한 내용은 모자이크 AI 모델 서비스를 참조하세요.
엔드포인트 가져오기
Databricks SDK 또는 Python API를 사용하여 엔드포인트의 메타데이터 및 상태를 가져올 수 있습니다.
Databricks SDK - Python
endpoint = workspace.serving_endpoints.get(name="customer-features")
# print(endpoint)
Python API
endpoint = fe.get_feature_serving_endpoint(name="customer-features")
# print(endpoint)
엔드포인트의 스키마 가져오기
REST API를 사용하여 엔드포인트의 스키마를 가져올 수 있습니다. 엔드포인트 스키마에 대한 자세한 내용은 엔드포인트 스키마를 제공하는 모델 가져오기를 참조하세요.
ACCESS_TOKEN=<token>
ENDPOINT_NAME=<endpoint name>
curl "https://example.databricks.com/api/2.0/serving-endpoints/$ENDPOINT_NAME/openapi" -H "Authorization: Bearer $ACCESS_TOKEN" -H "Content-Type: application/json"
엔드포인트 쿼리
REST API, MLflow 배포 SDK 또는 서비스 UI를 사용하여 엔드포인트를 쿼리할 수 있습니다.
다음 코드에서는 MLflow 배포 SDK를 사용할 때 자격 증명을 설정하고 클라이언트를 만드는 방법을 보여줍니다.
# Set up credentials
export DATABRICKS_HOST=...
export DATABRICKS_TOKEN=...
# Set up the client
import mlflow.deployments
client = mlflow.deployments.get_deploy_client("databricks")
참고 항목
보안 모범 사례로, 자동화된 도구, 시스템, 스크립트, 앱을 사용하여 인증할 때 Databricks는 작업 영역 사용자 대신 서비스 주체에 속한 개인용 액세스 토큰을 사용하는 것을 권장합니다. 서비스 주체에 대한 토큰을 만들려면 서비스 주체에 대한 토큰 관리를 참조하세요.
API를 사용하여 엔드포인트 쿼리
이 섹션에는 REST API 또는 MLflow 배포 SDK를 사용하여 엔드포인트를 쿼리하는 예제가 포함되어 있습니다.
REST API
curl -X POST -u token:$DATABRICKS_API_TOKEN $ENDPOINT_INVOCATION_URL \
-H 'Content-Type: application/json' \
-d '{"dataframe_records": [
{"user_id": 1, "ytd_spend": 598},
{"user_id": 2, "ytd_spend": 280}
]}'
MLflow 배포 SDK
import mlflow.deployments
client = mlflow.deployments.get_deploy_client("databricks")
response = client.predict(
endpoint="test-feature-endpoint",
inputs={
"dataframe_records": [
{"user_id": 1, "ytd_spend": 598},
{"user_id": 2, "ytd_spend": 280},
]
},
)
UI를 사용하여 엔드포인트 쿼리
서비스 UI에서 직접 서비스 엔드포인트를 쿼리할 수 있습니다. UI에는 엔드포인트를 쿼리하는 데 사용할 수 있는 생성된 코드 예제가 포함되어 있습니다.
Azure Databricks 작업 영역의 왼쪽 사이드바에서 서비스를 클릭합니다.
쿼리할 엔드포인트를 클릭합니다.
화면의 오른쪽 위에서 쿼리 엔드포인트를 클릭합니다.
요청 상자에 요청 본문을 JSON 형식으로 입력합니다.
요청 보내기를 클릭합니다.
// Example of a request body.
{
"dataframe_records": [
{"user_id": 1, "ytd_spend": 598},
{"user_id": 2, "ytd_spend": 280}
]
}
쿼리 엔드포인트 대화 상자에는 curl, Python 및 SQL에서 생성된 예제 코드가 포함됩니다. 탭을 클릭하여 예제 코드를 보고 복사합니다.
코드를 복사하려면 텍스트 상자의 오른쪽 상단에 있는 복사 아이콘을 클릭하세요.
엔드포인트 업데이트
REST API, Databricks SDK 또는 서비스 UI를 사용하여 엔드포인트를 업데이트할 수 있습니다.
API를 사용하여 엔드포인트 업데이트
REST API
curl -X PUT -u token:$DATABRICKS_API_TOKEN ${WORKSPACE_URL}/api/2.0/serving-endpoints/<endpoint_name>/config \
-H 'Content-Type: application/json' \
-d '"served_entities": [
{
"name": "customer-features",
"entity_name": "main.default.customer_features_new",
"workload_size": "Small",
"scale_to_zero_enabled": True
}
]'
Databricks SDK - Python
workspace.serving_endpoints.update_config(
name="my-serving-endpoint",
served_entities=[
ServedEntityInput(
entity_name="main.default.customer_features",
scale_to_zero_enabled=True,
workload_size="Small"
)
]
)
UI를 사용하여 엔드포인트 업데이트
서비스 제공 UI를 사용하려면 다음 단계를 따르세요.
- Azure Databricks 작업 영역의 왼쪽 사이드바에서 서비스를 클릭합니다.
- 테이블에서 업데이트하려는 엔드포인트의 이름을 클릭합니다. 엔드포인트 화면이 나타납니다.
- 화면의 오른쪽 위에서 엔드포인트 편집을 클릭합니다.
- 서비스 엔드포인트 편집 대화 상자에서 필요에 따라 엔드포인트 설정을 편집합니다.
- 변경 내용을 저장하려면 업데이트를 클릭합니다.
엔드포인트 삭제
Warning
이 작업은 되돌릴 수 없습니다.
REST API, Databricks SDK, Python API 또는 서비스 UI를 사용하여 엔드포인트를 삭제할 수 있습니다.
API를 사용하여 엔드포인트 삭제
REST API
curl -X DELETE -u token:$DATABRICKS_API_TOKEN ${WORKSPACE_URL}/api/2.0/serving-endpoints/<endpoint_name>
Databricks SDK - Python
workspace.serving_endpoints.delete(name="customer-features")
Python API
fe.delete_feature_serving_endpoint(name="customer-features")
UI를 사용하여 엔드포인트 삭제
다음 단계에 따라 서비스 UI를 사용하여 엔드포인트를 삭제합니다.
- Azure Databricks 작업 영역의 왼쪽 사이드바에서 서비스를 클릭합니다.
- 테이블에서 삭제할 엔드포인트의 이름을 클릭합니다. 엔드포인트 화면이 나타납니다.
- 화면의 오른쪽 위에서 kebab 메뉴 를 클릭하고 삭제를 선택합니다.
엔드포인트의 상태 모니터링
기능 제공 엔드포인트에 사용할 수 있는 로그 및 메트릭에 대한 자세한 내용은 모델 품질 및 엔드포인트 상태 모니터링을 참조하세요.
Access Control
기능 서비스 엔드포인트에 대한 사용 권한에 대한 자세한 내용은 엔드포인트를 제공하는 모델에 대한 권한 관리를 참조하세요.
예제 Notebook
이 Notebook에서는 Databricks SDK를 사용하여 Databricks 온라인 테이블을 사용하여 기능 서비스 엔드포인트를 만드는 방법을 보여 줍니다.