Delen via


YAML-schema voor CLI -onderdelenset (v2)

VAN TOEPASSING OP: Azure CLI ml-extensie v2 (huidige)

Notitie

De YAML-syntaxis die in dit document wordt beschreven, is gebaseerd op het JSON-schema voor de nieuwste versie van de ML CLI v2-extensie. Deze syntaxis werkt gegarandeerd alleen met de nieuwste versie van de ML CLI v2-extensie. U vindt de schema's voor oudere extensieversies op https://azuremlschemasprod.azureedge.net/.

YAML-syntaxis

Sleutel Type Description Toegestane waarden Default value
$schema tekenreeks Het YAML-schema. Als u de Azure Machine Learning VS Code-extensie gebruikt om het YAML-bestand te ontwerpen, inclusief $schema boven aan het bestand, kunt u schema- en resourcevoltooiingen aanroepen.
naam tekenreeks Vereist. Naam van functieset.
versie tekenreeks Vereist. Versie van de functieset.
beschrijving tekenreeks Beschrijving van functieset.
specificatie object Vereist. Specificatie van functieset.
specification.path tekenreeks Vereist pad naar de map met lokale functiesetspecificaties.
entities object (lijst met tekenreeksen) Vereist. De entiteiten waaraan deze functieset is gekoppeld.
fase tekenreeks Fase van functieset. Ontwikkeling, productie, gearchiveerd Ontwikkeling
tags object Woordenlijst met tags voor de functieset.
materialization_settings object Materialisatie-instelling van functieset.
materialization_settings.offline_enabled boolean Of het materialiseren van functiewaarden voor een offlineopslag is ingeschakeld. True, False
materialization_settings.schedule object Het materialisatieschema. Zie HET YAML-schema van CLI (v2) plannen
materialization_settings.schedule.frequency tekenreeks Vereist als de planning is geconfigureerd. Opsomming om de frequentie van een terugkeerschema te beschrijven. Dag, Uur, Minuut, Week, Maand Dag
materialization_settings.schedule.interval geheel getal Vereist als de planning is geconfigureerd. Het interval tussen terugkerende taken.
materialization_settings.schedule.time_zone tekenreeks De tijdzone van de schematrigger. UTC
materialization_settings.schedule.start_time tekenreeks De tijd van de schematrigger.
materialization_settings.notification object De instelling voor materialisatiemeldingen.
materialization_settings.notification.email_on object (lijst met tekenreeksen) Vereist als de melding is geconfigureerd. De e-mailmelding wordt verzonden wanneer de taakstatus overeenkomt met deze instelling. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails object (lijst met tekenreeksen) Vereist als de melding is geconfigureerd. Het e-mailadres waarnaar de melding wordt verzonden.
materialization_settings.resource object De Azure Machine Learning Spark-rekenresource die wordt gebruikt voor de materialisatietaak.
materialization_settings.resource.instance_type tekenreeks Type Azure Machine Learning Spark-rekenproces. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Raadpleeg Interactive Data Wrangling met Apache Spark in Azure Machine Learning (preview) om een bijgewerkte lijst met ondersteunde typen op te halen.
materialization_settings.spark_configuration woordenboek woordenlijst van spark-configuratie

Opmerkingen

De az ml feature-set opdracht kan worden gebruikt voor het beheren van de functieset.

Voorbeelden

Voorbeelden zijn beschikbaar in de GitHub-voorbeeldenopslagplaats. Hieronder ziet u een aantal.

YAML: basic

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: met materialisatieconfiguratie

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Volgende stappen