Udostępnij za pośrednictwem


Schemat YAML zestawu funkcji interfejsu wiersza polecenia (wersja 2)

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure ml w wersji 2 (bieżąca)

Uwaga

Składnia YAML szczegółowo w tym dokumencie jest oparta na schemacie JSON dla najnowszej wersji rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Ta składnia jest gwarantowana tylko do pracy z najnowszą wersją rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Schematy dla starszych wersji rozszerzeń można znaleźć pod adresem https://azuremlschemasprod.azureedge.net/.

Składnia YAML

Klucz Type Opis Dozwolone wartości Domyślna wartość
$schema string Schemat YAML. Jeśli używasz rozszerzenia programu VS Code usługi Azure Machine Learning do tworzenia pliku YAML, w tym $schema w górnej części pliku, umożliwia wywoływanie schematu i uzupełniania zasobów.
nazwa string Wymagany. Nazwa zestawu funkcji.
version string Wymagany. Wersja zestawu funkcji.
opis string Opis zestawu funkcji.
specyfikacja obiekt Wymagany. Specyfikacja zestawu funkcji.
specification.path string Wymagana ścieżka do folderu specyfikacji zestawu funkcji lokalnych.
encje object (lista ciągów) Wymagany. Jednostki, z którymi jest skojarzony ten zestaw funkcji.
etap string Etap zestawu funkcji. Programowanie, produkcja, zarchiwizowana Opracowywanie zawartości
tags obiekt Słownik tagów zestawu funkcji.
materialization_settings obiekt Ustawienie materializacji zestawu funkcji.
materialization_settings.offline_enabled boolean Określa, czy włączono materializowanie wartości funkcji do magazynu w trybie offline. Prawda, fałsz
materialization_settings.schedule obiekt Harmonogram materializacji. Zobacz schemat YAML dla harmonogramu interfejsu wiersza polecenia (wersja 2)
materialization_settings.schedule.frequency string Wymagane w przypadku skonfigurowania harmonogramu. Wyliczenie opisujące częstotliwość harmonogramu cyklu. Dzień, Godzina, Minuta, Tydzień, Miesiąc Dzień
materialization_settings.schedule.interval integer Wymagane w przypadku skonfigurowania harmonogramu. Interwał między powtarzalnymi zadaniami.
materialization_settings.schedule.time_zone string Strefa czasowa wyzwalacza harmonogramu. UTC
materialization_settings.schedule.start_time string Czas wyzwalacza harmonogramu.
materialization_settings.notification obiekt Ustawienie powiadomienia materializacji.
materialization_settings.notification.email_on object (lista ciągów) Wymagane w przypadku skonfigurowania powiadomienia. Powiadomienie e-mail jest wysyłane, gdy stan zadania jest zgodny z tym ustawieniem. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.email object (lista ciągów) Wymagane w przypadku skonfigurowania powiadomienia. Adres e-mail, na który jest wysyłane powiadomienie.
materialization_settings.resource obiekt Zasób obliczeniowy platformy Spark usługi Azure Machine Learning używany do zadania materializacji.
materialization_settings.resource.instance_type string Typ wystąpienia obliczeniowego platformy Spark w usłudze Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Zapoznaj się z tematem Interactive Data Wrangling with Apache Spark in Azure Machine Learning (wersja zapoznawcza), aby uzyskać zaktualizowaną listę obsługiwanych typów.
materialization_settings.spark_configuration słownik słownik konfiguracji platformy Spark

Uwagi

Polecenie az ml feature-set może służyć do zarządzania zestawem funkcji.

Przykłady

Przykłady są dostępne w repozytorium GitHub przykłady. Poniżej przedstawiono kilka z poniższych elementów.

YAML: podstawowy

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: z konfiguracją materializacji

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Następne kroki