Condividi tramite


Schema YAML del set di funzionalità dell'interfaccia della riga di comando (v2)

SI APPLICA A: estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)

Nota

La sintassi YAML descritta in dettaglio in questo documento si basa sullo schema JSON per la versione più recente dell'estensione dell'interfaccia della riga di comando di Machine Learning v2. Il funzionamento di questa sintassi è garantito solo con la versione più recente dell'estensione dell'interfaccia della riga di comando di Machine Learning v2. È possibile trovare gli schemi per le versioni di estensione precedenti in https://azuremlschemasprod.azureedge.net/.

Sintassi YAML

Chiave Type Descrizione Valori consentiti Default value
$schema string Schema YAML. Se si usa l'estensione VS Code di Azure Machine Learning per creare il file YAML, incluso $schema all'inizio del file consente di richiamare i completamenti dello schema e delle risorse.
name string Obbligatorio. Nome del set di funzionalità.
versione string Obbligatorio. Versione del set di funzionalità.
description stringa Descrizione del set di funzionalità.
specifica oggetto Obbligatorio. Specifica del set di funzionalità.
specification.path string Percorso obbligatorio per la cartella specifica del set di funzionalità locale.
entities object (elenco di stringhe) Obbligatorio. Le entità a cui è associato questo set di funzionalità.
fase string Fase del set di funzionalità. Sviluppo, produzione, archiviato Sviluppo
tag oggetto Dizionario di tag per il set di funzionalità.
materialization_settings oggetto Impostazione di materializzazione del set di funzionalità.
materialization_settings.offline_enabled boolean Indica se materializzare i valori delle funzionalità in un archivio offline è abilitato. Vero, falso
materialization_settings.schedule oggetto Pianificazione della materializzazione. Vedere Schema YAML della pianificazione dell'interfaccia della riga di comando (v2)
materialization_settings.schedule.frequency string Obbligatorio se la pianificazione è configurata. Enumerazione per descrivere la frequenza di una pianificazione di ricorrenza. Day, Hour, Minute, Week, Month Giorno
materialization_settings.schedule.interval integer Obbligatorio se la pianificazione è configurata. Intervallo tra processi ricorrenti.
materialization_settings.schedule.time_zone string Fuso orario del trigger di pianificazione. UTC
materialization_settings.schedule.start_time string Ora del trigger di pianificazione.
materialization_settings.notification oggetto Impostazione di notifica di materializzazione.
materialization_settings.notification.email_on object (elenco di stringhe) Obbligatorio se la notifica è configurata. La notifica tramite posta elettronica viene inviata quando lo stato del processo corrisponde a questa impostazione. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails object (elenco di stringhe) Obbligatorio se la notifica è configurata. Indirizzo di posta elettronica a cui viene inviata la notifica.
materialization_settings.resource oggetto Risorsa di calcolo Spark di Azure Machine Learning usata per il processo di materializzazione.
materialization_settings.resource.instance_type string Tipo di istanza di calcolo spark di Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3 Standard_E64s_v3. Fare riferimento a Interactive Data Wrangling con Apache Spark in Azure Machine Learning (anteprima) per ottenere un elenco aggiornato dei tipi supportati.
materialization_settings.spark_configuration dizionario dizionario della configurazione di Spark

Osservazioni:

Il az ml feature-set comando può essere usato per la gestione del set di funzionalità.

Esempi

Gli esempi sono disponibili nel repository GitHub di esempi. Di seguito sono riportati alcuni esempi.

YAML: di base

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: con configurazione di materializzazione

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Passaggi successivi