Схема yamL набора компонентов CLI (версия 2)
ОБЛАСТЬ ПРИМЕНЕНИЯ: расширение машинного обучения Azure CLI версии 2 (текущее)
Примечание.
Синтаксис YAML, описанный в этом документе, основан на схеме JSON для последней версии расширения ML CLI (версия 2). Этот синтаксис гарантированно работает только с последней версией расширения ML CLI (версия 2). Схемы для старых версий расширений можно найти по адресу https://azuremlschemasprod.azureedge.net/.
Синтаксис YAML
Ключ | Тип | Описание | Допустимые значения | Default value |
---|---|---|---|---|
$schema | строка | Схема YAML. Если вы используете расширение МАШИННОЕ ОБУЧЕНИЕ AZURE VS Code для создания ФАЙЛА YAML, включая $schema в верхней части файла, позволяет вызывать завершение схемы и ресурсов. | ||
name | строка | Обязательный. Имя набора компонентов. | ||
версия | строка | Обязательный. Версия набора компонентов. | ||
описание | строка | Описание набора компонентов. | ||
спецификация | объект | Обязательный. Спецификация набора компонентов. | ||
specification.path | строка | Обязательный путь к папке спецификации локального набора компонентов. | ||
entities | объект (список строк) | Обязательный. Сущности, с которым связан этот набор компонентов. | ||
постановка | строка | Этап набора компонентов. | Разработка, производство, архивированный | Разработка |
tags | объект | Словарь тегов для набора компонентов. | ||
materialization_settings | объект | Параметр материализации набора компонентов. | ||
materialization_settings.offline_enabled | boolean | Включена ли материализация значений признаков в автономном хранилище. | True, False | |
materialization_settings.schedule | объект | Расписание материализации. См. схему YAML для планирования интерфейса командной строки (2) | ||
materialization_settings.schedule.frequency | строка | Требуется, если расписание настроено. Перечисление для описания частоты расписания повторения. | День, час, минута, неделя, месяц | день |
materialization_settings.schedule.interval | integer | Требуется, если расписание настроено. Интервал между повторяющимися заданиями. | ||
materialization_settings.schedule.time_zone | строка | Часовой пояс триггера расписания. | UTC | |
materialization_settings.schedule.start_time | строка | Время триггера расписания. | ||
materialization_settings.notification | объект | Параметр уведомления о материализации. | ||
materialization_settings.notification.email_on | объект (список строк) | Требуется, если уведомление настроено. Уведомление по электронной почте отправляется, когда состояние задания соответствует этому параметру. | JobFailed, JobCompleted, JobCancelled. | |
materialization_settings.notification.emails | объект (список строк) | Требуется, если уведомление настроено. Адрес электронной почты, на который отправляется уведомление. | ||
materialization_settings.resource | объект | Вычислительный ресурс Spark Машинное обучение Azure, используемый для задания материализации. | ||
materialization_settings.resource.instance_type | строка | Машинное обучение Azure тип вычислительного экземпляра Spark. | Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Чтобы получить обновленный список поддерживаемых типов, обратитесь к интерактивному обработке данных с помощью Apache Spark в Машинное обучение Azure (предварительная версия). | |
materialization_settings.spark_configuration | dictionary | словарь конфигурации Spark |
Замечания
Для az ml feature-set
управления набором компонентов можно использовать команду.
Примеры
Примеры доступны в репозитории примеров GitHub. Ниже показаны некоторые из них.
YAML: базовый
$schema: http://azureml/sdk-2-0/Featureset.json
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
YAML: с конфигурацией материализации
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
materialization_settings:
offline_enabled: True
schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
type: recurrence # Only recurrence type would be supported
frequency: Day # Only support Day and Hour
interval: 1 #every day
time_zone: "Pacific Standard Time"
notification:
email_on:
- JobFailed
emails:
- alice@microsoft.com
resource:
instance_type: Standard_E8S_V3
spark_configuration:
spark.driver.cores: 4
spark.driver.memory: 36g
spark.executor.cores: 4
spark.executor.memory: 36g
spark.executor.instances: 2