Databricks 기능 엔지니어링 및 레거시 작업 영역 기능 저장소에 대한 릴리스 정보
이 페이지에는 Unity 카탈로그 클라이언트의 Databricks 기능 엔지니어링 및 Databricks 작업 영역 기능 저장소 클라이언트의 릴리스가 나열되어 있습니다. 두 클라이언트는 모두 Databricks-feature-engineering으로 PyPI에서 사용할 수 있습니다.
라이브러리는 다음을 위해 사용됩니다.
- 기능 테이블 만들기, 읽기 및 쓰기
- 기능 데이터에 대한 모델을 학습합니다.
- 실시간 서비스 제공을 위해 온라인 스토어에 기능 테이블 게시
사용 설명서는 Databricks 기능 저장소를 참조하세요. Python API 설명서는 Python API를 참조하세요.
Unity 카탈로그 클라이언트의 기능 엔지니어링은 Unity 카탈로그의 기능 및 기능 테이블에 대해 작동합니다. 작업 영역 기능 저장소 클라이언트는 작업 영역 기능 저장소의 기능 및 기능 테이블에 대해 작동합니다. 두 클라이언트는 모두 Machine Learning용 Databricks 런타임에 미리 설치되어 있습니다. PyPI(databricks-feature-engineering
)에서 설치 pip install databricks-feature-engineering
한 후 Databricks 런타임에서 실행할 수도 있습니다. 단위 테스트에만 두 클라이언트를 로컬로 또는 CI/CD 환경에서 사용할 수 있습니다.
Databricks Runtime 및 Databricks Runtime ML 버전과의 클라이언트 버전 호환성을 보여 주는 표는 기능 엔지니어링 호환성 매트릭스를 참조하세요. 이전 버전의 Databricks 작업 영역 기능 저장소 클라이언트는 PyPI에서 databricks-feature-store로 사용할 수 있습니다.
databricks-feature-engineering 0.8.0
-
score_batch
호출에서params
사용을 지원하여 유추를 위해 추가 매개변수를 모델에 전달할 수 있습니다. - 버그 수정 및 개선 사항
databricks-feature-engineering 0.7.0
- 이제 Unity 카탈로그의 특정 보기를 오프라인 모델 학습 및 평가를 위한 기능 테이블로 사용할 수 있습니다. Unity 카탈로그의 기능 테이블에서 읽기를 참조 하세요.
- 이제 기능 조회 또는 기능 사양을 사용하여 학습 집합을 만들 수 있습니다. Python SDK 참조를 참조하세요.
databricks-feature-engineering 0.6.0
- 이제 Tempo를 사용한 기존 지원 외에도 네이티브 Spark를 사용한 특정 시점 조인 실행이 지원됩니다. 아이디어를 제안 세미온 신첸코에 큰 감사!
-
StructType
는 이제 PySpark 데이터 형식으로 지원됩니다.StructType
은 온라인 서비스용으로 지원되지 않습니다. -
write_table
이제 액체 클러스터링을 사용하도록 설정된 테이블에 쓰기를 지원합니다 . - 매개
timeseries_columns
변수의create_table
이름이 .로timeseries_column
바뀌었습니다. 기존 워크플로는 매개 변수를 계속 사용할timeseries_columns
수 있습니다. -
score_batch
이제 매개 변수를env_manager
지원합니다. 자세한 내용은 MLflow 설명서를 참조하세요.
databricks-feature-engineering 0.5.0
- 사용자가 Unity 카탈로그에서
update_feature_spec
FeatureSpec의 소유자를 업데이트할 수 있는 새 APIdatabricks-feature-engineering
입니다.
databricks-feature-engineering 0.4.0
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-engineering 0.3.0
-
log_model
이제 온라인 모델 제공에 대한 성능 향상을 포함하는 새 databricks-feature-lookup PyPI 패키지를 사용합니다.
databricks-feature-store 0.17.0
-
databricks-feature-store
는 사용되지 않습니다. 이 패키지의 모든 기존 모듈은 버전 0.2.0 이상에서databricks-feature-engineering
사용할 수 있습니다. 자세한 내용은 Python API를 참조하세요.
databricks-feature-engineering 0.2.0
-
databricks-feature-engineering
이제 .의databricks-feature-store
모든 모듈이 포함됩니다. 자세한 내용은 Python API를 참조하세요.
databricks-feature-store 0.16.3
- 기능 테이블과 함께 AutoML을 사용할 때 시간 제한 버그를 수정합니다.
databricks-feature-engineering 0.1.3
- UpgradeClient의 작은 개선 사항.
databricks-feature-store 0.16.2
- 이제 기능 및 함수 서비스 엔드포인트를 만들 수 있습니다. 자세한 내용은 기능 및 함수 서비스를 참조 하세요.
databricks-feature-store 0.16.1
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-engineering 0.1.2 및 databricks-feature-store 0.16.0
- 사소한 버그 수정 사항 및 개선 사항
- 특정 작업 영역 설정으로 기록된 잘못된 작업 계보 URL을 수정했습니다.
databricks-feature-engineering 0.1.1
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-engineering 0.1.0
- Unity 카탈로그 Python 클라이언트에서 PyPI로 기능 엔지니어링의 GA 릴리스
databricks-feature-store 0.15.1
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-store 0.15.0
- 이제 모델을 기록할 때 입력 예제를 자동으로 유추하고 기록할 수 있습니다. 이렇게 하려면 호출
infer_model_example
할 때로True
설정합니다log_model
. 이 예제는 매개 변수에 지정된 학습 데이터를 기반으로 합니다training_set
.
databricks-feature-store 0.14.2
- MariaDB Connector/J >=2.7.5에서 Aurora MySQL에 게시하는 버그를 수정합니다.
databricks-feature-store 0.14.1
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-store 0.14.0
0.14.0부터 인수에 primary_keys
타임스탬프 키 열을 지정해야 합니다. 타임스탬프 키는 기능 테이블에서 각 행을 고유하게 식별하는 "기본 키"의 일부입니다. 다른 기본 키 열과 마찬가지로 타임스탬프 키 열에는 NULL 값이 포함될 수 없습니다.
다음 예제에서 DataFrame user_features_df
에는 다음 열이 user_id
ts
purchases_30d
포함됩니다. is_free_trial_active
0.14.0 이상
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 이하
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-store 0.13.0
- 필요한 최소
mlflow-skinny
버전은 2.4.0입니다. - 제공된 DataFrame에 필요한 조회 키가 모두 포함되어 있지 않으면 학습 집합을 만들지 못합니다.
- Unity 카탈로그에서 기능 테이블을 사용하는 모델을 로깅할 때 MLflow 서명이 모델과 함께 자동으로 기록됩니다.
databricks-feature-store 0.12.0
- 이제 API를 사용하여 온라인 저장소를 삭제할
drop_online_table
수 있습니다.
databricks-feature-store 0.11.0
- 이제 Unity 카탈로그 사용 작업 영역에서 작업 영역과 Unity 카탈로그 기능 테이블을 모두 Cosmos DB 온라인 저장소에 게시할 수 있습니다. 이를 위해서는 Databricks Runtime 13.0 ML 이상이 필요합니다.
databricks-feature-store 0.10.0
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-store 0.9.0
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-store 0.8.0
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-store 0.7.1
-
flask
를 사용해 모델을 채점할 때 누락된 종속성 문제를 해결할 종속성으로score_batch
를 추가합니다.
databricks-feature-store 0.7.0
- 사소한 버그 수정 사항 및 개선 사항
databricks-feature-store 0.6.1
- PyPI에 대한 Databricks Feature Store 클라이언트의 초기 공개 릴리스입니다.