다음을 통해 공유


Databricks 기능 엔지니어링 및 레거시 작업 영역 기능 저장소에 대한 릴리스 정보

이 페이지에는 Unity 카탈로그 클라이언트의 Databricks 기능 엔지니어링 및 Databricks 작업 영역 기능 저장소 클라이언트의 릴리스가 나열되어 있습니다. 두 클라이언트는 모두 Databricks-feature-engineering으로 PyPI에서 사용할 수 있습니다.

라이브러리는 다음을 위해 사용됩니다.

  • 기능 테이블 만들기, 읽기 및 쓰기
  • 기능 데이터에 대한 모델을 학습합니다.
  • 실시간 서비스 제공을 위해 온라인 스토어에 기능 테이블 게시

사용 설명서는 Databricks 기능 저장소를 참조하세요. Python API 설명서는 Python API를 참조하세요.

Unity 카탈로그 클라이언트의 기능 엔지니어링은 Unity 카탈로그의 기능 및 기능 테이블에 대해 작동합니다. 작업 영역 기능 저장소 클라이언트는 작업 영역 기능 저장소의 기능 및 기능 테이블에 대해 작동합니다. 두 클라이언트는 모두 Machine Learning용 Databricks 런타임에 미리 설치되어 있습니다. PyPI(databricks-feature-engineering)에서 설치 pip install databricks-feature-engineering 한 후 Databricks 런타임에서 실행할 수도 있습니다. 단위 테스트에만 두 클라이언트를 로컬로 또는 CI/CD 환경에서 사용할 수 있습니다.

Databricks Runtime 및 Databricks Runtime ML 버전과의 클라이언트 버전 호환성을 보여 주는 표는 기능 엔지니어링 호환성 매트릭스를 참조하세요. 이전 버전의 Databricks 작업 영역 기능 저장소 클라이언트는 PyPI에서 databricks-feature-store사용할 수 있습니다.

databricks-feature-engineering 0.8.0

  • score_batch 호출에서 params 사용을 지원하여 유추를 위해 추가 매개변수를 모델에 전달할 수 있습니다.
  • 버그 수정 및 개선 사항

databricks-feature-engineering 0.7.0

  • 이제 Unity 카탈로그의 특정 보기를 오프라인 모델 학습 및 평가를 위한 기능 테이블로 사용할 수 있습니다. Unity 카탈로그의 기능 테이블에서 읽기를 참조 하세요.
  • 이제 기능 조회 또는 기능 사양을 사용하여 학습 집합을 만들 수 있습니다. Python SDK 참조참조하세요.

databricks-feature-engineering 0.6.0

  • 이제 Tempo를 사용한 기존 지원 외에도 네이티브 Spark를 사용한 특정 시점 조인 실행이 지원됩니다. 아이디어를 제안 세미온 신첸코에 큰 감사!
  • StructType 는 이제 PySpark 데이터 형식으로 지원됩니다. StructType 은 온라인 서비스용으로 지원되지 않습니다.
  • write_table 이제 액체 클러스터링을 사용하도록 설정된 테이블에 쓰기를 지원합니다 .
  • 매개 timeseries_columns 변수의 create_table 이름이 .로 timeseries_column바뀌었습니다. 기존 워크플로는 매개 변수를 계속 사용할 timeseries_columns 수 있습니다.
  • score_batch 이제 매개 변수를 env_manager 지원합니다. 자세한 내용은 MLflow 설명서를 참조하세요.

databricks-feature-engineering 0.5.0

  • 사용자가 Unity 카탈로그에서 update_feature_spec FeatureSpec의 소유자를 업데이트할 수 있는 새 API databricks-feature-engineering 입니다.

databricks-feature-engineering 0.4.0

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-engineering 0.3.0

  • log_model 이제 온라인 모델 제공에 대한 성능 향상을 포함하는 새 databricks-feature-lookup PyPI 패키지를 사용합니다.

databricks-feature-store 0.17.0

  • databricks-feature-store는 사용되지 않습니다. 이 패키지의 모든 기존 모듈은 버전 0.2.0 이상에서 databricks-feature-engineering 사용할 수 있습니다. 자세한 내용은 Python API를 참조하세요.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering 이제 .의 databricks-feature-store모든 모듈이 포함됩니다. 자세한 내용은 Python API를 참조하세요.

databricks-feature-store 0.16.3

  • 기능 테이블과 함께 AutoML을 사용할 때 시간 제한 버그를 수정합니다.

databricks-feature-engineering 0.1.3

  • UpgradeClient의 작은 개선 사항.

databricks-feature-store 0.16.2

  • 이제 기능 및 함수 서비스 엔드포인트를 만들 수 있습니다. 자세한 내용은 기능 및 함수 서비스를 참조 하세요.

databricks-feature-store 0.16.1

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-engineering 0.1.2 및 databricks-feature-store 0.16.0

  • 사소한 버그 수정 사항 및 개선 사항
    • 특정 작업 영역 설정으로 기록된 잘못된 작업 계보 URL을 수정했습니다.

databricks-feature-engineering 0.1.1

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-engineering 0.1.0

  • Unity 카탈로그 Python 클라이언트에서 PyPI로 기능 엔지니어링의 GA 릴리스

databricks-feature-store 0.15.1

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-store 0.15.0

  • 이제 모델을 기록할 때 입력 예제를 자동으로 유추하고 기록할 수 있습니다. 이렇게 하려면 호출infer_model_example할 때로 True 설정합니다log_model. 이 예제는 매개 변수에 지정된 학습 데이터를 기반으로 합니다 training_set .

databricks-feature-store 0.14.2

  • MariaDB Connector/J >=2.7.5에서 Aurora MySQL에 게시하는 버그를 수정합니다.

databricks-feature-store 0.14.1

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-store 0.14.0

0.14.0부터 인수에 primary_keys 타임스탬프 키 열을 지정해야 합니다. 타임스탬프 키는 기능 테이블에서 각 행을 고유하게 식별하는 "기본 키"의 일부입니다. 다른 기본 키 열과 마찬가지로 타임스탬프 키 열에는 NULL 값이 포함될 수 없습니다.

다음 예제에서 DataFrame user_features_df 에는 다음 열이 user_idtspurchases_30d포함됩니다. is_free_trial_active

0.14.0 이상

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 이하

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-store 0.13.0

  • 필요한 최소 mlflow-skinny 버전은 2.4.0입니다.
  • 제공된 DataFrame에 필요한 조회 키가 모두 포함되어 있지 않으면 학습 집합을 만들지 못합니다.
  • Unity 카탈로그에서 기능 테이블을 사용하는 모델을 로깅할 때 MLflow 서명이 모델과 함께 자동으로 기록됩니다.

databricks-feature-store 0.12.0

  • 이제 API를 사용하여 온라인 저장소를 삭제할 drop_online_table 수 있습니다.

databricks-feature-store 0.11.0

  • 이제 Unity 카탈로그 사용 작업 영역에서 작업 영역과 Unity 카탈로그 기능 테이블을 모두 Cosmos DB 온라인 저장소에 게시할 수 있습니다. 이를 위해서는 Databricks Runtime 13.0 ML 이상이 필요합니다.

databricks-feature-store 0.10.0

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-store 0.9.0

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-store 0.8.0

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-store 0.7.1

  • flask를 사용해 모델을 채점할 때 누락된 종속성 문제를 해결할 종속성으로 score_batch를 추가합니다.

databricks-feature-store 0.7.0

  • 사소한 버그 수정 사항 및 개선 사항

databricks-feature-store 0.6.1

  • PyPI에 대한 Databricks Feature Store 클라이언트의 초기 공개 릴리스입니다.