Sdílet prostřednictvím


Schéma YAML sady funkcí rozhraní příkazového řádku (v2)

PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)

Poznámka:

Syntaxe YAML podrobná v tomto dokumentu je založená na schématu JSON pro nejnovější verzi rozšíření ML CLI v2. Tato syntaxe je zaručena pouze pro práci s nejnovější verzí rozšíření ML CLI v2. Schémata pro starší verze rozšíření najdete na adrese https://azuremlschemasprod.azureedge.net/.

Syntaxe YAML

Klíč Typ Popis Povolené hodnoty Default value
$schema string Schéma YAML. Pokud k vytvoření souboru YAML použijete rozšíření Azure Machine Learning VS Code, včetně $schema v horní části souboru, můžete vyvolat dokončení schématu a prostředků.
name string Povinný: Název sady funkcí
version string Povinný: Verze sady funkcí
description string Popis sady funkcí
specifikace objekt Povinný: Specifikace sady funkcí
specification.path string Požadovaná cesta ke složce specifikace místní sady funkcí.
entities object (seznam řetězců) Povinný: Entity, ke kterým je tato sada funkcí přidružená.
etapa string Fáze sady funkcí Vývoj, Výroba, Archivováno Vývoj
značky objekt Slovník značek pro sadu funkcí
materialization_settings objekt Nastavení materializace sady funkcí
materialization_settings.offline_enabled boolean Určuje, jestli je povolená materializace hodnot funkcí do offline úložiště. True, False
materialization_settings.schedule objekt Plán materializace. Viz schéma YAML plánu ROZHRANÍ příkazového řádku (v2).
materialization_settings.schedule.frequency string Vyžaduje se, pokud je nakonfigurovaný plán. Výčet popisuje frekvenci plánu opakování. Den, Hodina, Minuta, Týden, Měsíc Den
materialization_settings.schedule.interval integer Vyžaduje se, pokud je nakonfigurovaný plán. Interval mezi opakovanými úlohami.
materialization_settings.schedule.time_zone string Časové pásmo aktivace plánu. UTC
materialization_settings.schedule.start_time string Čas aktivace plánu.
materialization_settings.notification objekt Nastavení oznámení materializace
materialization_settings.notification.email_on object (seznam řetězců) Vyžaduje se , pokud je nakonfigurováno oznámení. E-mailové oznámení se odešle, když stav úlohy odpovídá tomuto nastavení. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.email object (seznam řetězců) Vyžaduje se , pokud je nakonfigurováno oznámení. E-mailová adresa, na kterou se oznámení odešle.
materialization_settings.resource objekt Výpočetní prostředek Sparku služby Azure Machine Learning používaný pro úlohu materializace
materialization_settings.resource.instance_type string Typ výpočetní instance Sparku ve službě Azure Machine Learning Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Aktualizovaný seznam podporovaných typů najdete v tématu Interaktivní transformace dat pomocí Apache Sparku ve službě Azure Machine Learning (Preview).
materialization_settings.spark_configuration slovník slovník konfigurace Sparku

Poznámky

Příkaz az ml feature-set lze použít ke správě sady funkcí.

Příklady

Příklady jsou k dispozici v příkladech v úložišti GitHub. Níže je uvedeno několik.

YAML: základní

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: s konfigurací materializace

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Další kroky