YAML-schema voor CLI -onderdelenset (v2)
VAN TOEPASSING OP: Azure CLI ml-extensie v2 (huidige)
Notitie
De YAML-syntaxis die in dit document wordt beschreven, is gebaseerd op het JSON-schema voor de nieuwste versie van de ML CLI v2-extensie. Deze syntaxis werkt gegarandeerd alleen met de nieuwste versie van de ML CLI v2-extensie. U vindt de schema's voor oudere extensieversies op https://azuremlschemasprod.azureedge.net/.
YAML-syntaxis
Sleutel | Type | Description | Toegestane waarden | Default value |
---|---|---|---|---|
$schema | tekenreeks | Het YAML-schema. Als u de Azure Machine Learning VS Code-extensie gebruikt om het YAML-bestand te ontwerpen, inclusief $schema boven aan het bestand, kunt u schema- en resourcevoltooiingen aanroepen. | ||
naam | tekenreeks | Vereist. Naam van functieset. | ||
versie | tekenreeks | Vereist. Versie van de functieset. | ||
beschrijving | tekenreeks | Beschrijving van functieset. | ||
specificatie | object | Vereist. Specificatie van functieset. | ||
specification.path | tekenreeks | Vereist pad naar de map met lokale functiesetspecificaties. | ||
entities | object (lijst met tekenreeksen) | Vereist. De entiteiten waaraan deze functieset is gekoppeld. | ||
fase | tekenreeks | Fase van functieset. | Ontwikkeling, productie, gearchiveerd | Ontwikkeling |
tags | object | Woordenlijst met tags voor de functieset. | ||
materialization_settings | object | Materialisatie-instelling van functieset. | ||
materialization_settings.offline_enabled | boolean | Of het materialiseren van functiewaarden voor een offlineopslag is ingeschakeld. | True, False | |
materialization_settings.schedule | object | Het materialisatieschema. Zie HET YAML-schema van CLI (v2) plannen | ||
materialization_settings.schedule.frequency | tekenreeks | Vereist als de planning is geconfigureerd. Opsomming om de frequentie van een terugkeerschema te beschrijven. | Dag, Uur, Minuut, Week, Maand | Dag |
materialization_settings.schedule.interval | geheel getal | Vereist als de planning is geconfigureerd. Het interval tussen terugkerende taken. | ||
materialization_settings.schedule.time_zone | tekenreeks | De tijdzone van de schematrigger. | UTC | |
materialization_settings.schedule.start_time | tekenreeks | De tijd van de schematrigger. | ||
materialization_settings.notification | object | De instelling voor materialisatiemeldingen. | ||
materialization_settings.notification.email_on | object (lijst met tekenreeksen) | Vereist als de melding is geconfigureerd. De e-mailmelding wordt verzonden wanneer de taakstatus overeenkomt met deze instelling. | JobFailed, JobCompleted, JobCancelled. | |
materialization_settings.notification.emails | object (lijst met tekenreeksen) | Vereist als de melding is geconfigureerd. Het e-mailadres waarnaar de melding wordt verzonden. | ||
materialization_settings.resource | object | De Azure Machine Learning Spark-rekenresource die wordt gebruikt voor de materialisatietaak. | ||
materialization_settings.resource.instance_type | tekenreeks | Type Azure Machine Learning Spark-rekenproces. | Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Raadpleeg Interactive Data Wrangling met Apache Spark in Azure Machine Learning (preview) om een bijgewerkte lijst met ondersteunde typen op te halen. | |
materialization_settings.spark_configuration | woordenboek | woordenlijst van spark-configuratie |
Opmerkingen
De az ml feature-set
opdracht kan worden gebruikt voor het beheren van de functieset.
Voorbeelden
Voorbeelden zijn beschikbaar in de GitHub-voorbeeldenopslagplaats. Hieronder ziet u een aantal.
YAML: basic
$schema: http://azureml/sdk-2-0/Featureset.json
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
YAML: met materialisatieconfiguratie
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
materialization_settings:
offline_enabled: True
schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
type: recurrence # Only recurrence type would be supported
frequency: Day # Only support Day and Hour
interval: 1 #every day
time_zone: "Pacific Standard Time"
notification:
email_on:
- JobFailed
emails:
- alice@microsoft.com
resource:
instance_type: Standard_E8S_V3
spark_configuration:
spark.driver.cores: 4
spark.driver.memory: 36g
spark.executor.cores: 4
spark.executor.memory: 36g
spark.executor.instances: 2