YAML-Schema für den Feature Store der CLI (v2)
GILT FÜR Azure CLI-ML-Erweiterung v2 (aktuell)
Hinweis
Die in diesem Dokument beschriebene YAML-Syntax basiert auf dem JSON-Schema für die neueste Version der ML CLI v2-Erweiterung. Die Funktion dieser Syntax wird nur mit der neuesten Version der ML CLI v2-Erweiterung garantiert. Die Schemas für ältere Erweiterungsversionen finden Sie unter https://azuremlschemasprod.azureedge.net/.
YAML-Syntax
Schlüssel | type | BESCHREIBUNG | Zulässige Werte | Standardwert |
---|---|---|---|---|
$schema | Zeichenfolge | Das YAML-Schema. Wenn Sie die Erweiterung „VS Code“ für Azure Machine Learning zum Erstellen einer YAML-Datei verwenden, können Sie durch das Einfügen von „$schema“ am Anfang der Datei Schema- und Ressourcenvervollständigungen aufrufen. | ||
name | Zeichenfolge | Erforderlich. Name des Feature Stores. | ||
compute_runtime | Objekt (object) | Die Konfiguration der Computeruntime, die für den Materialisierungsauftrag verwendet wird. | ||
compute_runtime.spark_runtime_version | Zeichenfolge | Die Spark-Runtimeversion für Azure Machine Learning. | 3.4 | 3.4 |
offline_store | Objekt (object) | |||
offline_store.type | Zeichenfolge | Erforderlich, wenn offline_store angegeben ist. Der Typ des Offlinespeichers. Nur der Speichertyp Data Lake Gen2 wird unterstützt. | azure_data_lake_gen2 | |
offline_store.target | Zeichenfolge | Erforderlich, wenn offline_store angegeben ist. Der Data Lake Gen2-Speicher-URI im Format /subscriptions/<subscription_id>/resourceGroups/<resource_group>/providers/Microsoft.Storage/storageAccounts/<account>/blobServices/default/containers/<container> . |
||
online_store | Objekt | |||
online_store.type | Zeichenfolge | Erforderlich , wenn online_store angegeben wird. Der Typ des Online-Stores. Nur Redis-Cache wird unterstützt. | redis | |
online_store.target | Zeichenfolge | Erforderlich , wenn online_store angegeben wird. Der Redis Cache-URI im Format von /subscriptions/<subscription_id>/resourceGroups/<resource_group>/providers/Microsoft.Cache/Redis/<redis-name> . |
||
materialization_identity | Objekt (object) | Die benutzerseitig zugewiesene verwaltete Identität, die für den Materialisierungsauftrag verwendet wird. Diese Identität muss erforderlichen Rollen für den Zugriff auf den Featurespeicherdienst, die Datenquelle und den Offlinespeicher gewährt werden. | ||
materialization_identity.client_id | Zeichenfolge | Die Client-ID Ihrer benutzerseitig zugewiesenen verwalteten Identität. | ||
materialization_identity.resource_id | Zeichenfolge | Die Ressourcen-ID Ihrer benutzerseitig zugewiesenen verwalteten Identität. | ||
materialization_identity.principal_id | Zeichenfolge | Die Prinzipal-ID Ihrer benutzerseitig zugewiesenen verwalteten Identität. | ||
description | Zeichenfolge | Beschreibung des Feature Stores. | ||
tags | Objekt (object) | Wörterbuch der Tags für den Feature Store. | ||
display_name | Zeichenfolge | Anzeigename des Feature Stores auf der Benutzeroberfläche von Studio. Kann innerhalb der Ressourcengruppe uneindeutig sein. | ||
location | Zeichenfolge | Der Speicherort des Feature Stores. | Der Speicherort der Ressourcengruppe. | |
resource_group | Zeichenfolge | Die Ressourcengruppe mit dem Feature Store. Wenn die Ressourcengruppe nicht vorhanden ist, wird eine neue erstellt. |
Sie können andere Arbeitsbereichseigenschaften einschließen.
Bemerkungen
Mit dem Befehl az ml feature-store
können Sie Azure Feature Store-Arbeitsbereiche für Machine Learning verwalten.
Beispiele
Beispiele finden Sie im GitHub-Beispielrepository. Hier finden Sie einige gängige Beispiele:
YAML-Grundlagen
$schema: http://azureml/sdk-2-0/FeatureStore.json
name: mktg-feature-store
location: eastus
YAML mit Offlinespeicherkonfiguration
$schema: http://azureml/sdk-2-0/FeatureStore.json
name: mktg-feature-store
compute_runtime:
spark_runtime_version: 3.2
offline_store:
type: azure_data_lake_gen2
target: /subscriptions/<sub-id>/resourceGroups/<rg>/providers/Microsoft.Storage/storageAccounts/<account_name>/blobServices/default/containers/<container_name>
materialization_identity:
client_id: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
resource_id: /subscriptions/<sub-id>/resourceGroups/<rg>/providers/Microsoft.ManagedIdentity/userAssignedIdentities/<uai-name>
# Many of workspace parameters will also be supported:
location: eastus
display_name: marketing feature store
tags:
foo: bar
Konfigurieren des Onlinespeichers in der CLI mit YAML
$schema: http://azureml/sdk-2-0/FeatureStore.json
name: mktg-feature-store
compute_runtime:
spark_runtime_version: 3.4
online_store:
type: redis
target: "/subscriptions/<sub-id>/resourceGroups/<rg>/providers/Microsoft.Cache/Redis/<redis-name>"
materialization_identity:
client_id: 00001111-aaaa-2222-bbbb-3333cccc4444
principal_id: aaaaaaaa-bbbb-cccc-1111-222222222222
resource_id: /subscriptions/<sub-id>/resourceGroups/<rg>/providers/Microsoft.ManagedIdentity/userAssignedIdentities/<uai-name>
# Many of workspace parameters will also be supported:
location: eastus
display_name: marketing feature store
tags:
foo: bar
Konfigurieren des Online-Stores in der CLI mit Python
redis_arm_id = f"/subscriptions/{subscription_id}/resourceGroups/{resource_group_name}/providers/Microsoft.Cache/Redis/{redis_name}"
online_store = MaterializationStore(type="redis", target=redis_arm_id)
fs = FeatureStore(
name=featurestore_name,
location=location,
online_store=online_store,
)
# wait for feature store creation
fs_poller = ml_client.feature_stores.begin_create(fs)
# move the feature store to a YAML file
yaml_path = root_dir + "/featurestore/featurestore_with_online.yaml"
fs.dump(yaml_path)