Schéma YAML sady funkcí rozhraní příkazového řádku (v2)
PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)
Poznámka:
Syntaxe YAML podrobná v tomto dokumentu je založená na schématu JSON pro nejnovější verzi rozšíření ML CLI v2. Tato syntaxe je zaručena pouze pro práci s nejnovější verzí rozšíření ML CLI v2. Schémata pro starší verze rozšíření najdete na adrese https://azuremlschemasprod.azureedge.net/.
Syntaxe YAML
Klíč | Typ | Popis | Povolené hodnoty | Default value |
---|---|---|---|---|
$schema | string | Schéma YAML. Pokud k vytvoření souboru YAML použijete rozšíření Azure Machine Learning VS Code, včetně $schema v horní části souboru, můžete vyvolat dokončení schématu a prostředků. | ||
name | string | Povinný: Název sady funkcí | ||
version | string | Povinný: Verze sady funkcí | ||
description | string | Popis sady funkcí | ||
specifikace | objekt | Povinný: Specifikace sady funkcí | ||
specification.path | string | Požadovaná cesta ke složce specifikace místní sady funkcí. | ||
entities | object (seznam řetězců) | Povinný: Entity, ke kterým je tato sada funkcí přidružená. | ||
etapa | string | Fáze sady funkcí | Vývoj, Výroba, Archivováno | Vývoj |
značky | objekt | Slovník značek pro sadu funkcí | ||
materialization_settings | objekt | Nastavení materializace sady funkcí | ||
materialization_settings.offline_enabled | boolean | Určuje, jestli je povolená materializace hodnot funkcí do offline úložiště. | True, False | |
materialization_settings.schedule | objekt | Plán materializace. Viz schéma YAML plánu ROZHRANÍ příkazového řádku (v2). | ||
materialization_settings.schedule.frequency | string | Vyžaduje se, pokud je nakonfigurovaný plán. Výčet popisuje frekvenci plánu opakování. | Den, Hodina, Minuta, Týden, Měsíc | Den |
materialization_settings.schedule.interval | integer | Vyžaduje se, pokud je nakonfigurovaný plán. Interval mezi opakovanými úlohami. | ||
materialization_settings.schedule.time_zone | string | Časové pásmo aktivace plánu. | UTC | |
materialization_settings.schedule.start_time | string | Čas aktivace plánu. | ||
materialization_settings.notification | objekt | Nastavení oznámení materializace | ||
materialization_settings.notification.email_on | object (seznam řetězců) | Vyžaduje se , pokud je nakonfigurováno oznámení. E-mailové oznámení se odešle, když stav úlohy odpovídá tomuto nastavení. | JobFailed, JobCompleted, JobCancelled. | |
materialization_settings.notification.email | object (seznam řetězců) | Vyžaduje se , pokud je nakonfigurováno oznámení. E-mailová adresa, na kterou se oznámení odešle. | ||
materialization_settings.resource | objekt | Výpočetní prostředek Sparku služby Azure Machine Learning používaný pro úlohu materializace | ||
materialization_settings.resource.instance_type | string | Typ výpočetní instance Sparku ve službě Azure Machine Learning | Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Aktualizovaný seznam podporovaných typů najdete v tématu Interaktivní transformace dat pomocí Apache Sparku ve službě Azure Machine Learning (Preview). | |
materialization_settings.spark_configuration | slovník | slovník konfigurace Sparku |
Poznámky
Příkaz az ml feature-set
lze použít ke správě sady funkcí.
Příklady
Příklady jsou k dispozici v příkladech v úložišti GitHub. Níže je uvedeno několik.
YAML: základní
$schema: http://azureml/sdk-2-0/Featureset.json
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
YAML: s konfigurací materializace
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
materialization_settings:
offline_enabled: True
schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
type: recurrence # Only recurrence type would be supported
frequency: Day # Only support Day and Hour
interval: 1 #every day
time_zone: "Pacific Standard Time"
notification:
email_on:
- JobFailed
emails:
- alice@microsoft.com
resource:
instance_type: Standard_E8S_V3
spark_configuration:
spark.driver.cores: 4
spark.driver.memory: 36g
spark.executor.cores: 4
spark.executor.memory: 36g
spark.executor.instances: 2