Schema YAML del set di funzionalità dell'interfaccia della riga di comando (v2)
SI APPLICA A: estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)
Nota
La sintassi YAML descritta in dettaglio in questo documento si basa sullo schema JSON per la versione più recente dell'estensione dell'interfaccia della riga di comando di Machine Learning v2. Il funzionamento di questa sintassi è garantito solo con la versione più recente dell'estensione dell'interfaccia della riga di comando di Machine Learning v2. È possibile trovare gli schemi per le versioni di estensione precedenti in https://azuremlschemasprod.azureedge.net/.
Sintassi YAML
Chiave | Type | Descrizione | Valori consentiti | Default value |
---|---|---|---|---|
$schema | string | Schema YAML. Se si usa l'estensione VS Code di Azure Machine Learning per creare il file YAML, incluso $schema all'inizio del file consente di richiamare i completamenti dello schema e delle risorse. | ||
name | string | Obbligatorio. Nome del set di funzionalità. | ||
versione | string | Obbligatorio. Versione del set di funzionalità. | ||
description | stringa | Descrizione del set di funzionalità. | ||
specifica | oggetto | Obbligatorio. Specifica del set di funzionalità. | ||
specification.path | string | Percorso obbligatorio per la cartella specifica del set di funzionalità locale. | ||
entities | object (elenco di stringhe) | Obbligatorio. Le entità a cui è associato questo set di funzionalità. | ||
fase | string | Fase del set di funzionalità. | Sviluppo, produzione, archiviato | Sviluppo |
tag | oggetto | Dizionario di tag per il set di funzionalità. | ||
materialization_settings | oggetto | Impostazione di materializzazione del set di funzionalità. | ||
materialization_settings.offline_enabled | boolean | Indica se materializzare i valori delle funzionalità in un archivio offline è abilitato. | Vero, falso | |
materialization_settings.schedule | oggetto | Pianificazione della materializzazione. Vedere Schema YAML della pianificazione dell'interfaccia della riga di comando (v2) | ||
materialization_settings.schedule.frequency | string | Obbligatorio se la pianificazione è configurata. Enumerazione per descrivere la frequenza di una pianificazione di ricorrenza. | Day, Hour, Minute, Week, Month | Giorno |
materialization_settings.schedule.interval | integer | Obbligatorio se la pianificazione è configurata. Intervallo tra processi ricorrenti. | ||
materialization_settings.schedule.time_zone | string | Fuso orario del trigger di pianificazione. | UTC | |
materialization_settings.schedule.start_time | string | Ora del trigger di pianificazione. | ||
materialization_settings.notification | oggetto | Impostazione di notifica di materializzazione. | ||
materialization_settings.notification.email_on | object (elenco di stringhe) | Obbligatorio se la notifica è configurata. La notifica tramite posta elettronica viene inviata quando lo stato del processo corrisponde a questa impostazione. | JobFailed, JobCompleted, JobCancelled. | |
materialization_settings.notification.emails | object (elenco di stringhe) | Obbligatorio se la notifica è configurata. Indirizzo di posta elettronica a cui viene inviata la notifica. | ||
materialization_settings.resource | oggetto | Risorsa di calcolo Spark di Azure Machine Learning usata per il processo di materializzazione. | ||
materialization_settings.resource.instance_type | string | Tipo di istanza di calcolo spark di Azure Machine Learning. | Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3 Standard_E64s_v3. Fare riferimento a Interactive Data Wrangling con Apache Spark in Azure Machine Learning (anteprima) per ottenere un elenco aggiornato dei tipi supportati. | |
materialization_settings.spark_configuration | dizionario | dizionario della configurazione di Spark |
Osservazioni:
Il az ml feature-set
comando può essere usato per la gestione del set di funzionalità.
Esempi
Gli esempi sono disponibili nel repository GitHub di esempi. Di seguito sono riportati alcuni esempi.
YAML: di base
$schema: http://azureml/sdk-2-0/Featureset.json
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
YAML: con configurazione di materializzazione
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
materialization_settings:
offline_enabled: True
schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
type: recurrence # Only recurrence type would be supported
frequency: Day # Only support Day and Hour
interval: 1 #every day
time_zone: "Pacific Standard Time"
notification:
email_on:
- JobFailed
emails:
- alice@microsoft.com
resource:
instance_type: Standard_E8S_V3
spark_configuration:
spark.driver.cores: 4
spark.driver.memory: 36g
spark.executor.cores: 4
spark.executor.memory: 36g
spark.executor.instances: 2