Freigeben über


YAML-Schema für den Feature Store der CLI (v2)

GILT FÜR Azure CLI-ML-Erweiterung v2 (aktuell)

Hinweis

Die in diesem Dokument beschriebene YAML-Syntax basiert auf dem JSON-Schema für die neueste Version der ML CLI v2-Erweiterung. Die Funktion dieser Syntax wird nur mit der neuesten Version der ML CLI v2-Erweiterung garantiert. Die Schemas für ältere Erweiterungsversionen finden Sie unter https://azuremlschemasprod.azureedge.net/.

YAML-Syntax

Schlüssel type BESCHREIBUNG Zulässige Werte Standardwert
$schema Zeichenfolge Das YAML-Schema. Wenn Sie die Erweiterung „VS Code“ für Azure Machine Learning zum Erstellen einer YAML-Datei verwenden, können Sie durch das Einfügen von „$schema“ am Anfang der Datei Schema- und Ressourcenvervollständigungen aufrufen.
name Zeichenfolge Erforderlich. Name des Feature Stores.
compute_runtime Objekt (object) Die Konfiguration der Computeruntime, die für den Materialisierungsauftrag verwendet wird.
compute_runtime.spark_runtime_version Zeichenfolge Die Spark-Runtimeversion für Azure Machine Learning. 3.4 3.4
offline_store Objekt (object)
offline_store.type Zeichenfolge Erforderlich, wenn offline_store angegeben ist. Der Typ des Offlinespeichers. Nur der Speichertyp Data Lake Gen2 wird unterstützt. azure_data_lake_gen2
offline_store.target Zeichenfolge Erforderlich, wenn offline_store angegeben ist. Der Data Lake Gen2-Speicher-URI im Format /subscriptions/<subscription_id>/resourceGroups/<resource_group>/providers/Microsoft.Storage/storageAccounts/<account>/blobServices/default/containers/<container>.
online_store Objekt
online_store.type Zeichenfolge Erforderlich , wenn online_store angegeben wird. Der Typ des Online-Stores. Nur Redis-Cache wird unterstützt. redis
online_store.target Zeichenfolge Erforderlich , wenn online_store angegeben wird. Der Redis Cache-URI im Format von /subscriptions/<subscription_id>/resourceGroups/<resource_group>/providers/Microsoft.Cache/Redis/<redis-name>.
materialization_identity Objekt (object) Die benutzerseitig zugewiesene verwaltete Identität, die für den Materialisierungsauftrag verwendet wird. Diese Identität muss erforderlichen Rollen für den Zugriff auf den Featurespeicherdienst, die Datenquelle und den Offlinespeicher gewährt werden.
materialization_identity.client_id Zeichenfolge Die Client-ID Ihrer benutzerseitig zugewiesenen verwalteten Identität.
materialization_identity.resource_id Zeichenfolge Die Ressourcen-ID Ihrer benutzerseitig zugewiesenen verwalteten Identität.
materialization_identity.principal_id Zeichenfolge Die Prinzipal-ID Ihrer benutzerseitig zugewiesenen verwalteten Identität.
description Zeichenfolge Beschreibung des Feature Stores.
tags Objekt (object) Wörterbuch der Tags für den Feature Store.
display_name Zeichenfolge Anzeigename des Feature Stores auf der Benutzeroberfläche von Studio. Kann innerhalb der Ressourcengruppe uneindeutig sein.
location Zeichenfolge Der Speicherort des Feature Stores. Der Speicherort der Ressourcengruppe.
resource_group Zeichenfolge Die Ressourcengruppe mit dem Feature Store. Wenn die Ressourcengruppe nicht vorhanden ist, wird eine neue erstellt.

Sie können andere Arbeitsbereichseigenschaften einschließen.

Bemerkungen

Mit dem Befehl az ml feature-store können Sie Azure Feature Store-Arbeitsbereiche für Machine Learning verwalten.

Beispiele

Beispiele finden Sie im GitHub-Beispielrepository. Hier finden Sie einige gängige Beispiele:

YAML-Grundlagen

$schema: http://azureml/sdk-2-0/FeatureStore.json
name: mktg-feature-store
location: eastus

YAML mit Offlinespeicherkonfiguration

$schema: http://azureml/sdk-2-0/FeatureStore.json
name: mktg-feature-store

compute_runtime:
    spark_runtime_version: 3.2

offline_store:
    type: azure_data_lake_gen2
    target: /subscriptions/<sub-id>/resourceGroups/<rg>/providers/Microsoft.Storage/storageAccounts/<account_name>/blobServices/default/containers/<container_name>

materialization_identity:
    client_id: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
    resource_id: /subscriptions/<sub-id>/resourceGroups/<rg>/providers/Microsoft.ManagedIdentity/userAssignedIdentities/<uai-name>

# Many of workspace parameters will also be supported:
location: eastus
display_name: marketing feature store
tags:
  foo: bar

Konfigurieren des Onlinespeichers in der CLI mit YAML

$schema: http://azureml/sdk-2-0/FeatureStore.json
name: mktg-feature-store

compute_runtime:
  spark_runtime_version: 3.4

online_store:
  type: redis
  target: "/subscriptions/<sub-id>/resourceGroups/<rg>/providers/Microsoft.Cache/Redis/<redis-name>"

materialization_identity:
  client_id: 00001111-aaaa-2222-bbbb-3333cccc4444
  principal_id: aaaaaaaa-bbbb-cccc-1111-222222222222
  resource_id: /subscriptions/<sub-id>/resourceGroups/<rg>/providers/Microsoft.ManagedIdentity/userAssignedIdentities/<uai-name>

# Many of workspace parameters will also be supported:
location: eastus
display_name: marketing feature store
tags:
  foo: bar

Konfigurieren des Online-Stores in der CLI mit Python

redis_arm_id = f"/subscriptions/{subscription_id}/resourceGroups/{resource_group_name}/providers/Microsoft.Cache/Redis/{redis_name}"
online_store = MaterializationStore(type="redis", target=redis_arm_id)
 
fs = FeatureStore(
    name=featurestore_name,
    location=location,
    online_store=online_store,
)
 
# wait for feature store creation
fs_poller = ml_client.feature_stores.begin_create(fs)

# move the feature store to a YAML file

yaml_path = root_dir + "/featurestore/featurestore_with_online.yaml"
fs.dump(yaml_path)

Nächste Schritte