你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
CLI (v2) 计划用于模型监视的 YAML 架构(预览版)
本文档中详细介绍的 YAML 语法基于最新版本的 ML CLI v2 扩展的 JSON 架构。 此语法必定仅适用于最新版本的 ML CLI v2 扩展。 详尽的 JSON 架构请参见 https://azuremlschemas.azureedge.net/latest/monitorSchedule.schema.json。 可以在 https://azuremlschemasprod.azureedge.net/ 上查找早期扩展版本的架构。
YAML 语法
密钥 | 类型 | 说明 | 允许的值 |
---|---|---|---|
$schema |
字符串 | YAML 架构。 | |
name |
字符串 | 必需。 计划名称。 | |
description |
string | 计划的描述。 | |
tags |
object | 计划的标记字典。 | |
trigger |
object | 必需。 用于定义何时触发作业的规则的触发器配置。 必须指定 RecurrenceTrigger 或 CronTrigger 。 |
|
create_monitor |
object | 必需。 将由计划触发的监视的定义。 MonitorDefinition 是必需的。 |
触发器配置
重复触发器
密钥 | 类型 | 说明 | 允许的值 |
---|---|---|---|
type |
字符串 | 必需。 指定计划类型。 | recurrence |
frequency |
字符串 | 必需。 指定描述计划触发频率的时间单位。 | |
interval |
整型 | 必需。 指定计划触发的时间间隔。 | |
start_time |
字符串 | 使用时区描述开始日期和时间。 如果省略 start_time ,第一个作业将立即运行,以后的作业根据计划触发,即 start_time 等于作业创建时间。 如果开始时间在过去,则第一个作业将在下一个计算的运行时间运行。 |
|
end_time |
字符串 | 用时区描述结束日期和时间。 如果省略 end_time ,计划将继续运行,直到被显式禁用为止。 |
|
timezone |
字符串 | 指定定期时区。 如果省略,则默认为 UTC。 | 请参阅时区值附录 |
pattern |
object | 指定定期模式。 如果省略模式,将根据 start_time、frequency 和 interval 的逻辑触发作业。 |
定期计划
定期计划定义定期模式,包含 hours
、minutes
和 weekdays
。
- 当频率为
day
时,模式可指定hours
和minutes
。 - 当频率为
week
和month
时,模式可指定hours
、minutes
和weekdays
。
密钥 | 类型 | 允许的值 |
---|---|---|
hours |
整数或整数数组 | 0-23 |
minutes |
整数或整数数组 | 0-59 |
week_days |
字符串或字符串数组 |
CronTrigger
密钥 | 类型 | 说明 | 允许的值 |
---|---|---|---|
type |
字符串 | 必需。 指定计划类型。 | cron |
expression |
字符串 | 必需。 指定用于定义如何触发作业的 cron 表达式。 表达式使用标准 crontab 表达式来表达定期计划。 单个表达式由 5 个空格分隔的字段组成:MINUTES HOURS DAYS MONTHS DAYS-OF-WEEK |
|
start_time |
字符串 | 使用时区描述开始日期和时间。 如果省略 start_time,第一个作业将立即运行,以后的作业根据计划触发,即 start_time 等于作业创建时间。 如果开始时间在过去,则第一个作业将在下一个计算的运行时间运行。 | |
end_time |
字符串 | 用时区描述结束日期和时间。 如果 end_time 被省略,计划将继续运行,直到被显式禁用为止。 | |
timezone |
字符串 | 指定定期时区。 如果省略,则默认为 UTC。 | 请参阅时区值附录 |
监视定义
密钥 | 类型 | 说明 | 允许的值 | 默认值 |
---|---|---|---|---|
compute |
Object | “必需”。 用于运行监视作业的 Spark 池计算资源的说明。 | ||
compute.instance_type |
String | “必需”。 要用于 Spark 池的计算实例类型。 | “standard_e4s_v3”、“standard_e8s_v3”、“standard_e16s_v3”、“standard_e32s_v3”、“standard_e64s_v3” | 不适用 |
compute.runtime_version |
String | 可选。 定义 Spark 运行时版本。 | 3.3 |
3.3 |
monitoring_target |
Object | 与模型监视关联的 Azure 机器学习资产。 | ||
monitoring_target.ml_task |
字符串 | 模型的机器学习任务。 | 允许的值为:classification 、regression 、question_answering |
|
monitoring_target.endpoint_deployment_id |
字符串 | 可选。 关联的 Azure 机器学习终结点/部署 ID,格式为 azureml:myEndpointName:myDeploymentName 。 如果终结点/部署已启用模型数据收集用于模型监视,则此字段是必需的。 |
||
monitoring_target.model_id |
String | 可选。 用于模型监视的关联模型 ID。 | ||
monitoring_signals |
Object | 要包含的监视信号字典。 键是监视上下文中监视信号的名称,值是包含监视信号规范的对象。 对于使用最近的以往生产数据作为比较基线并具有 3 个监视信号(数据偏移、预测偏移和数据质量)的基本模型监视可选。 | ||
alert_notification |
字符串或对象 | 警报通知收件人的说明。 | 允许两个警报目标之一:azmonitoring 字符串或 emails 对象(包含电子邮件收件人数组) |
|
alert_notification.emails |
Object | 要接收警报通知的电子邮件地址列表。 |
监视信号
数据偏移
随着用于训练模型的数据在生产中不断演变,数据的分布可能会发生变化,从而导致训练数据与模型用于预测的真实数据之间的不匹配。 数据偏移是当用于训练模型的输入数据的统计属性随时间变化时,机器学习中发生的一种现象。
密钥 | 类型 | 说明 | 允许的值 | 默认值 |
---|---|---|---|---|
type |
String | “必需”。 监视信号的类型。 根据此处指定的 type 自动加载预生成的监视信号处理组件。 |
data_drift |
data_drift |
production_data |
Object | 可选。 要分析以监视信号的生产数据的说明。 | ||
production_data.input_data |
Object | 可选。 输入数据源的说明,请参阅作业输入数据规范。 | ||
production_data.data_context |
String | 数据的上下文,它引用模型生产数据,可以是模型输入或模型输出 | model_inputs |
|
production_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset 和 production_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start 和 production_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
production_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 production_data.data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
reference_data |
Object | 可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。 | ||
reference_data.input_data |
Object | 输入数据源的说明,请参阅作业输入数据规范。 | ||
reference_data.data_context |
String | 数据的上下文,它是指之前使用数据集的上下文 | ||
reference_data.data_column_names.target_column |
Object | 可选。 如果 reference_data 是训练数据,则需要此属性来监视数据偏移的前 N 个特征。 |
||
reference_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset 和 reference_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start 和 reference_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
reference_data_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 reference_data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
features |
Object | 可选。 要为数据偏移监视的目标特征。 某些模型可能有数百或数千个特征,始终建议指定感兴趣的特征进行监视。 | 以下值之一:特征名称列表、features.top_n_feature_importance 或 all_features |
如果 production_data.data_context 为 training ,则默认值为 features.top_n_feature_importance = 10 ;否则,默认值为 all_features |
alert_enabled |
布尔 | 打开/关闭监视信号的警报通知。 True 或 False |
||
metric_thresholds |
Object | 监视信号的指标和阈值属性列表。 超过阈值且 alert_enabled 为 true 时,用户将收到警报通知。 |
||
metric_thresholds.numerical |
Object | 可选。 key:value 格式的指标和阈值列表,其中 key 是指标名称,value 是阈值。 |
允许的数字指标名称:jensen_shannon_distance 、normalized_wasserstein_distance 、population_stability_index 、two_sample_kolmogorov_smirnov_test |
|
metric_thresholds.categorical |
Object | 可选。 “key:value”格式的指标和阈值列表,其中“key”是指标名称,“value”是阈值。 | 允许的分类指标名称:jensen_shannon_distance 、chi_squared_test 、population_stability_index |
预测偏移
预测偏移通过将模型预测输出与验证或测试标记的数据或最近的过往生产数据进行比较来跟踪其分布的变化。
密钥 | 类型 | 说明 | 允许的值 | 默认值 |
---|---|---|---|---|
type |
String | “必需”。 监视信号的类型。 根据此处指定的 type 自动加载预生成的监视信号处理组件。 |
prediction_drift |
prediction_drift |
production_data |
Object | 可选。 要分析以监视信号的生产数据的说明。 | ||
production_data.input_data |
Object | 可选。 输入数据源的说明,请参阅作业输入数据规范。 | ||
production_data.data_context |
String | 数据的上下文,它引用模型生产数据,可以是模型输入或模型输出 | model_outputs |
|
production_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset 和 production_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start 和 production_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
production_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 production_data.data.input_data.type 为 uri_folder 时是必填项。 有关预处理组件规范的详细信息,请参阅预处理组件规范。 |
||
reference_data |
Object | 可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。 | ||
reference_data.input_data |
Object | 输入数据源的说明,请参阅作业输入数据规范。 | ||
reference_data.data_context |
String | 数据的上下文,它是指之前使用数据集的上下文 | ||
reference_data.data_column_names.target_column |
Object | 可选。 如果“rreference_data”是训练数据,则需要此属性来监视数据偏移的前 N 个特征。 | ||
reference_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset 和 reference_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start 和 reference_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
reference_data_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 reference_data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
features |
Object | 可选。 要为数据偏移监视的目标特征。 某些模型可能有数百或数千个特征,始终建议指定感兴趣的特征进行监视。 | 以下值之一:特征名称列表、features.top_n_feature_importance 或 all_features |
如果 production_data.data_context 为 training ,则默认值为 features.top_n_feature_importance = 10 ;否则,默认值为 all_features |
alert_enabled |
布尔 | 打开/关闭监视信号的警报通知。 True 或 False |
||
metric_thresholds |
Object | 监视信号的指标和阈值属性列表。 超过阈值且 alert_enabled 为 true 时,用户将收到警报通知。 |
||
metric_thresholds.numerical |
Object | 可选。 “key:value”格式的指标和阈值列表,其中“key”是指标名称,“value”是阈值。 | 允许的数字指标名称:jensen_shannon_distance 、normalized_wasserstein_distance 、population_stability_index 、two_sample_kolmogorov_smirnov_test |
|
metric_thresholds.categorical |
Object | 可选。 “key:value”格式的指标和阈值列表,其中“key”是指标名称,“value”是阈值。 | 允许的分类指标名称:jensen_shannon_distance 、chi_squared_test 、population_stability_index |
数据质量
数据质量信号通过比较训练数据或最近的过往生产数据来跟踪生产中的数据质量问题。
密钥 | 类型 | 说明 | 允许的值 | 默认值 |
---|---|---|---|---|
type |
String | “必需”。 监视信号的类型。 根据此处指定的 type 自动加载预生成的监视信号处理组件 |
data_quality |
data_quality |
production_data |
Object | 可选。 要分析以监视信号的生产数据的说明。 | ||
production_data.input_data |
Object | 可选。 输入数据源的说明,请参阅作业输入数据规范。 | ||
production_data.data_context |
String | 数据的上下文,它引用模型生产数据,可以是模型输入或模型输出 | %> | |
production_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset 和 production_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start 和 production_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
production_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 production_data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
reference_data |
Object | 可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。 | ||
reference_data.input_data |
Object | 输入数据源的说明,请参阅作业输入数据规范。 | ||
reference_data.data_context |
String | 数据的上下文,它是指之前使用数据集的上下文 | ||
reference_data.data_column_names.target_column |
对象 | 可选。 如果“rreference_data”是训练数据,则需要此属性来监视数据偏移的前 N 个特征。 | ||
reference_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset 和 reference_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start 和 reference_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
reference_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 reference_data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
features |
Object | 可选。 要为数据质量监视的目标特征。 某些模型可能具有数百或数千个特征。 始终建议指定感兴趣的特征进行监视。 | 以下值之一:特征名称列表、features.top_n_feature_importance 或 all_features |
如果 reference_data.data_context 为 training ,则默认值为 features.top_n_feature_importance = 10 ;否则,默认值为 all_features |
alert_enabled |
布尔 | 打开/关闭监视信号的警报通知。 True 或 False |
||
metric_thresholds |
Object | 监视信号的指标和阈值属性列表。 超过阈值且 alert_enabled 为 true 时,用户将收到警报通知。 |
||
metric_thresholds.numerical |
Object | key:value 格式的指标和阈值的可选列表,其中 key 是指标名称,value 是阈值。 |
允许的数字指标名称:data_type_error_rate 、null_value_rate 、out_of_bounds_rate |
|
metric_thresholds.categorical |
Object | key:value 格式的指标和阈值的可选列表,其中 key 是指标名称,value 是阈值。 |
允许的分类指标名称:data_type_error_rate 、null_value_rate 、out_of_bounds_rate |
特征归因偏移(预览版)
由于数据分布的变化、特征之间关系的变化或正在解决的基础问题的变化,模型的特征归因可能会随时间而改变。 特征归因偏移是当特征对预测输出的重要性或贡献随时间变化时,机器学习模型中发生的一种现象。
密钥 | 类型 | 说明 | 允许的值 | 默认值 |
---|---|---|---|---|
type |
String | “必需”。 监视信号的类型。 根据此处指定的 type 自动加载预生成的监视信号处理组件 |
feature_attribution_drift |
feature_attribution_drift |
production_data |
Array | 可选;如果未提供,则默认为与 Azure 机器学习终结点关联的收集的数据。 production_data 是数据集及其关联的元数据的列表,它必须包括模型输入和模型输出数据。 它可以是具有模型输入和输出的单个数据集,也可以是包含一个模型输入和一个模型输出的两个单独的数据集。 |
||
production_data.input_data |
Object | 可选。 输入数据源的说明,请参阅作业输入数据规范。 | ||
production_data.input_data.data_column_names |
Object | key:value 格式的关联列名和预测列名,它们是数据联接所必需的。 |
允许的键包括:correlation_id 、target_column |
|
production_data.data_context |
字符串 | 数据的上下文。 它指的是生产模型输入数据。 | .- . | |
production_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset 和 production_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start 和 production_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
production_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 production_data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
production_data.data_window_size |
字符串 | 可选。 ISO8601 格式的数据窗口大小(以天为单位),例如 P7D 。 这是要为数据质量问题计算的生产数据窗口。 |
默认情况下,数据窗口大小为最后一个监视期。 | |
reference_data |
Object | 可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。 | ||
reference_data.input_data |
Object | 输入数据源的说明,请参阅作业输入数据规范。 | ||
reference_data.data_context |
String | 数据的上下文,它是指之前使用数据集的上下文。 对于特征属性偏移,仅允许 training 数据。 |
training |
|
reference_data.data_column_names.target_column |
字符串 | 必需。 | ||
reference_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset 和 reference_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start 和 reference_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
reference_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 reference_data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
alert_enabled |
布尔 | 打开/关闭监视信号的警报通知。 True 或 False |
||
metric_thresholds |
Object | key:value 格式的特性属性偏移的指标名称和阈值,其中 key 是指标名称,value 是阈值。 超过阈值且 alert_enabled 处于打开状态时,用户将收到警报通知。 |
允许的指标名称:normalized_discounted_cumulative_gain |
自定义监视信号
通过自定义 Azure 机器学习组件自定义监视信号。
密钥 | 类型 | 说明 | 允许的值 | 默认值 |
---|---|---|---|---|
type |
String | “必需”。 监视信号的类型。 根据此处指定的 type 自动加载预生成的监视信号处理组件。 |
custom |
custom |
component_id |
字符串 | 必需。 与你的自定义信号相对应的 Azure 机器学习组件 ID。 例如 azureml:mycustomcomponent:1 |
||
input_data |
Object | 可选。 监视信号要分析的输入数据的说明,请参阅作业输入数据规范。 | ||
input_data.<data_name>.data_context |
字符串 | 数据的上下文,它引用模型生产数据,可以是模型输入或模型输出 | model_inputs |
|
input_data.<data_name>.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 input_data.<data_name>.data_window.lookback_window_offset 和 input_data.<data_name>.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 input_data.<data_name>.data_window.window_start 和 input_data.<data_name>.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
input_data.<data_name>.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 input_data.<data_name>.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
alert_enabled |
布尔 | 打开/关闭监视信号的警报通知。 True 或 False |
||
metric_thresholds.metric_name |
Object | 自定义指标的名称。 | ||
threshold |
Object | 自定义指标的可接受阈值。 |
模型性能(预览版)
模型性能跟踪生产中模型输出的客观性能的方式是将其与收集的地面实况数据进行比较。
密钥 | 类型 | 说明 | 允许的值 | 默认值 |
---|---|---|---|---|
type |
String | “必需”。 监视信号的类型。 根据此处指定的 type 自动加载预生成的监视信号处理组件 |
model_performance |
model_performance |
production_data |
Array | 可选;如果未提供,则默认为与 Azure 机器学习终结点关联的收集的数据。 production_data 是数据集及其关联的元数据的列表,它必须包括模型输入和模型输出数据。 它可以是具有模型输入和输出的单个数据集,也可以是包含一个模型输入和一个模型输出的两个单独的数据集。 |
||
production_data.input_data |
Object | 可选。 输入数据源的说明,请参阅作业输入数据规范。 | ||
production_data.input_data.data_column_names |
Object | key:value 格式的关联列名和预测列名,它们是数据联接所必需的。 |
允许的键包括:correlation_id 、target_column |
|
production_data.data_context |
字符串 | 数据的上下文。 它指的是生产模型输入数据。 | .- . | |
production_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset 和 production_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start 和 production_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
production_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 production_data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
production_data.data_window_size |
字符串 | 可选。 ISO8601 格式的数据窗口大小(以天为单位),例如 P7D 。 这是要为数据质量问题计算的生产数据窗口。 |
默认情况下,数据窗口大小为最后一个监视期。 | |
reference_data |
Object | 可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。 | ||
reference_data.input_data |
Object | 输入数据源的说明,请参阅作业输入数据规范。 | ||
reference_data.data_context |
String | 数据的上下文,它是指之前使用数据集的上下文。 对于特征属性偏移,仅允许 training 数据。 |
training |
|
reference_data.data_column_names.target_column |
字符串 | 必需。 | ||
reference_data.data_window |
Object | 可选。 要用作比较基线数据的引用数据的数据窗口。 | 仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset 和 reference_data.data_window.lookback_window_size 属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start 和 reference_data.data_window.window_end 属性。 所有属性值都必须采用 ISO8601 格式。 |
|
reference_data.pre_processing_component |
字符串 | 已注册组件的组件 ID(采用 azureml:myPreprocessing@latest 格式)。 如果 reference_data.input_data.type 为 uri_folder ,则为必需项,请参阅预处理组件规范。 |
||
alert_enabled |
布尔 | 打开/关闭监视信号的警报通知。 True 或 False |
||
metric_thresholds.classification |
Object | key:value 格式的指标和阈值的可选列表,其中 key 是指标名称,value 是阈值。 |
允许的 classification 指标名称:accuracy 、precision 、recall |
|
metric_thresholds.regression |
Object | key:value 格式的指标和阈值的可选列表,其中 key 是指标名称,value 是阈值。 |
允许的 regression 指标名称:mae 、mse 、rmse |
注解
az ml schedule
命令可用于管理 Azure 机器学习模型。
示例
示例 GitHub 存储库中提供了监视 CLI 示例。 一些指标和阈值如下:
YAML:现成的监视器
# out-of-box-monitoring.yaml
$schema: http://azureml/sdk-2-0/Schedule.json
name: credit_default_model_monitoring
display_name: Credit default model monitoring
description: Credit default model monitoring setup with minimal configurations
trigger:
# perform model monitoring activity daily at 3:15am
type: recurrence
frequency: day #can be minute, hour, day, week, month
interval: 1 # #every day
schedule:
hours: 3 # at 3am
minutes: 15 # at 15 mins after 3am
create_monitor:
compute: # specify a spark compute for monitoring job
instance_type: standard_e4s_v3
runtime_version: "3.3"
monitoring_target:
ml_task: classification # model task type: [classification, regression, question_answering]
endpoint_deployment_id: azureml:credit-default:main # azureml endpoint deployment id
alert_notification: # emails to get alerts
emails:
- abc@example.com
- def@example.com
YAML:高级监视器
# advanced-model-monitoring.yaml
$schema: http://azureml/sdk-2-0/Schedule.json
name: fraud_detection_model_monitoring
display_name: Fraud detection model monitoring
description: Fraud detection model monitoring with advanced configurations
trigger:
# perform model monitoring activity daily at 3:15am
type: recurrence
frequency: day #can be minute, hour, day, week, month
interval: 1 # #every day
schedule:
hours: 3 # at 3am
minutes: 15 # at 15 mins after 3am
create_monitor:
compute:
instance_type: standard_e4s_v3
runtime_version: "3.3"
monitoring_target:
ml_task: classification
endpoint_deployment_id: azureml:credit-default:main
monitoring_signals:
advanced_data_drift: # monitoring signal name, any user defined name works
type: data_drift
# reference_dataset is optional. By default referece_dataset is the production inference data associated with Azure Machine Learning online endpoint
reference_data:
input_data:
path: azureml:credit-reference:1 # use training data as comparison reference dataset
type: mltable
data_context: training
data_column_names:
target_column: DEFAULT_NEXT_MONTH
features:
top_n_feature_importance: 10 # monitor drift for top 10 features
metric_thresholds:
numerical:
jensen_shannon_distance: 0.01
categorical:
pearsons_chi_squared_test: 0.02
advanced_data_quality:
type: data_quality
# reference_dataset is optional. By default reference_dataset is the production inference data associated with Azure Machine Learning online endpoint
reference_data:
input_data:
path: azureml:credit-reference:1
type: mltable
data_context: training
features: # monitor data quality for 3 individual features only
- SEX
- EDUCATION
metric_thresholds:
numerical:
null_value_rate: 0.05
categorical:
out_of_bounds_rate: 0.03
feature_attribution_drift_signal:
type: feature_attribution_drift
# production_data: is not required input here
# Please ensure Azure Machine Learning online endpoint is enabled to collected both model_inputs and model_outputs data
# Azure Machine Learning model monitoring will automatically join both model_inputs and model_outputs data and used it for computation
reference_data:
input_data:
path: azureml:credit-reference:1
type: mltable
data_context: training
data_column_names:
target_column: DEFAULT_NEXT_MONTH
metric_thresholds:
normalized_discounted_cumulative_gain: 0.9
alert_notification:
emails:
- abc@example.com
- def@example.com
附录
时区
当前计划支持以下时区。 键可直接在 Python SDK 中使用,而值可在 YAML 作业中使用。 下表按 UTC(协调世界时)进行整理。
UTC | 密钥 | 值 |
---|---|---|
UTC -12:00 | DATELINE_STANDARD_TIME | “国际日期变更线标准时间” |
UTC -11:00 | UTC_11 | “UTC-11” |
UTC - 10:00 | ALEUTIAN_STANDARD_TIME | 阿留申群岛标准时间 |
UTC - 10:00 | HAWAIIAN_STANDARD_TIME | “夏威夷标准时间” |
UTC -09:30 | MARQUESAS_STANDARD_TIME | “马克萨斯标准时间” |
UTC -09:00 | ALASKAN_STANDARD_TIME | “阿拉斯加标准时间” |
UTC -09:00 | UTC_09 | “UTC-09” |
UTC -08:00 | PACIFIC_STANDARD_TIME_MEXICO | “太平洋标准时间(墨西哥)” |
UTC -08:00 | UTC_08 | “UTC-08” |
UTC -08:00 | PACIFIC_STANDARD_TIME | “太平洋标准时间” |
UTC -07:00 | US_MOUNTAIN_STANDARD_TIME | “美国山地标准时间” |
UTC -07:00 | MOUNTAIN_STANDARD_TIME_MEXICO | “山地标准时间(墨西哥)” |
UTC -07:00 | MOUNTAIN_STANDARD_TIME | “山地标准时间” |
UTC -06:00 | CENTRAL_AMERICA_STANDARD_TIME | “中美洲标准时间” |
UTC -06:00 | CENTRAL_STANDARD_TIME | “中部标准时间” |
UTC -06:00 | EASTER_ISLAND_STANDARD_TIME | “复活节岛标准时间” |
UTC -06:00 | CENTRAL_STANDARD_TIME_MEXICO | “中部标准时间(墨西哥)” |
UTC -06:00 | CANADA_CENTRAL_STANDARD_TIME | “加拿大中部标准时间” |
UTC -05:00 | SA_PACIFIC_STANDARD_TIME | “南美洲太平洋标准时间” |
UTC -05:00 | EASTERN_STANDARD_TIME_MEXICO | “东部标准时间(墨西哥)” |
UTC -05:00 | EASTERN_STANDARD_TIME | “东部标准时间” |
UTC -05:00 | HAITI_STANDARD_TIME | “海地标准时间” |
UTC -05:00 | CUBA_STANDARD_TIME | “古巴标准时间” |
UTC -05:00 | US_EASTERN_STANDARD_TIME | “美国东部标准时间” |
UTC -05:00 | TURKS_AND_CAICOS_STANDARD_TIME | “特克斯和凯科斯群岛标准时间” |
UTC -04:00 | PARAGUAY_STANDARD_TIME | “巴拉圭标准时间” |
UTC -04:00 | ATLANTIC_STANDARD_TIME | “大西洋标准时间” |
UTC -04:00 | VENEZUELA_STANDARD_TIME | “委内瑞拉标准时间” |
UTC -04:00 | CENTRAL_BRAZILIAN_STANDARD_TIME | “巴西中部标准时间” |
UTC -04:00 | SA_WESTERN_STANDARD_TIME | “南美洲西部标准时间” |
UTC -04:00 | PACIFIC_SA_STANDARD_TIME | “太平洋南美洲标准时间” |
UTC -03:30 | NEWFOUNDLAND_STANDARD_TIME | “纽芬兰标准时间” |
UTC -03:00 | TOCANTINS_STANDARD_TIME | “托坎廷斯标准时间” |
UTC -03:00 | E_SOUTH_AMERICAN_STANDARD_TIME | “E. 南美洲标准时间” |
UTC -03:00 | SA_EASTERN_STANDARD_TIME | “南美洲东部标准时间” |
UTC -03:00 | ARGENTINA_STANDARD_TIME | “阿根廷标准时间” |
UTC -03:00 | GREENLAND_STANDARD_TIME | “格陵兰标准时间” |
UTC -03:00 | MONTEVIDEO_STANDARD_TIME | “蒙得维的亚标准时间” |
UTC -03:00 | SAINT_PIERRE_STANDARD_TIME | “圣皮埃尔标准时间” |
UTC -03:00 | BAHIA_STANDARD_TIM | “巴伊亚标准时间” |
UTC -02:00 | UTC_02 | “UTC-02” |
UTC -02:00 | MID_ATLANTIC_STANDARD_TIME | “中大西洋标准时间” |
UTC -01:00 | AZORES_STANDARD_TIME | “亚速尔群岛标准时间” |
UTC -01:00 | CAPE_VERDE_STANDARD_TIME | “佛得角群岛标准时间” |
UTC | UTC | UTC |
UTC +00:00 | GMT_STANDARD_TIME | “GMT 标准时间” |
UTC +00:00 | GREENWICH_STANDARD_TIME | “格林威治标准时间” |
UTC +01:00 | MOROCCO_STANDARD_TIME | “摩洛哥标准时间” |
UTC +01:00 | W_EUROPE_STANDARD_TIME | “西 欧标准时间” |
UTC +01:00 | CENTRAL_EUROPE_STANDARD_TIME | “中欧标准时间” |
UTC +01:00 | ROMANCE_STANDARD_TIME | “罗马标准时间” |
UTC +01:00 | CENTRAL_EUROPEAN_STANDARD_TIME | “中欧标准时间” |
UTC +01:00 | W_CENTRAL_AFRICA_STANDARD_TIME | “中非 西部标准时间” |
UTC +02:00 | NAMIBIA_STANDARD_TIME | “纳米比亚标准时间” |
UTC +02:00 | JORDAN_STANDARD_TIME | “约旦标准时间” |
UTC +02:00 | GTB_STANDARD_TIME | “GTB 标准时间” |
UTC +02:00 | MIDDLE_EAST_STANDARD_TIME | “中东标准时间” |
UTC +02:00 | EGYPT_STANDARD_TIME | “埃及标准时间” |
UTC +02:00 | E_EUROPE_STANDARD_TIME | “E. 欧标准时间” |
UTC +02:00 | SYRIA_STANDARD_TIME | “叙利亚标准时间” |
UTC +02:00 | WEST_BANK_STANDARD_TIME | “西岸标准时间” |
UTC +02:00 | SOUTH_AFRICA_STANDARD_TIME | “南非标准时间” |
UTC +02:00 | FLE_STANDARD_TIME | “FLE 标准时间” |
UTC +02:00 | ISRAEL_STANDARD_TIME | “以色列标准时间” |
UTC +02:00 | KALININGRAD_STANDARD_TIME | “加里宁格勒标准时间” |
UTC +02:00 | LIBYA_STANDARD_TIME | “利比亚标准时间” |
UTC +03:00 | TÜRKIYE_STANDARD_TIME | “土耳其标准时间” |
UTC +03:00 | ARABIC_STANDARD_TIME | “阿拉伯标准时间” |
UTC +03:00 | ARAB_STANDARD_TIME | “阿拉伯标准时间” |
UTC +03:00 | BELARUS_STANDARD_TIME | “白俄罗斯标准时间” |
UTC +03:00 | RUSSIAN_STANDARD_TIME | “俄罗斯标准时间” |
UTC +03:00 | E_AFRICA_STANDARD_TIME | “E. 非标准时间” |
UTC +03:30 | IRAN_STANDARD_TIME | “伊朗标准时间” |
UTC +04:00 | ARABIAN_STANDARD_TIME | “阿拉伯半岛标准时间” |
UTC +04:00 | ASTRAKHAN_STANDARD_TIME | “阿斯特拉罕标准时间” |
UTC +04:00 | AZERBAIJAN_STANDARD_TIME | “阿塞拜疆标准时间” |
UTC +04:00 | RUSSIA_TIME_ZONE_3 | “俄罗斯时区 3” |
UTC +04:00 | MAURITIUS_STANDARD_TIME | “毛里求斯标准时间” |
UTC +04:00 | GEORGIAN_STANDARD_TIME | “格鲁吉亚标准时间” |
UTC +04:00 | CAUCASUS_STANDARD_TIME | “高加索标准时间” |
UTC +04:30 | AFGHANISTAN_STANDARD_TIME | “阿富汗标准时间” |
UTC +05:00 | WEST_ASIA_STANDARD_TIME | “西亚标准时间” |
UTC +05:00 | EKATERINBURG_STANDARD_TIME | “叶卡捷琳堡标准时间” |
UTC +05:00 | PAKISTAN_STANDARD_TIME | “巴基斯坦标准时间” |
UTC +05:30 | INDIA_STANDARD_TIME | “印度标准时间” |
UTC +05:30 | SRI_LANKA_STANDARD_TIME | “斯里兰卡标准时间” |
UTC +05:45 | NEPAL_STANDARD_TIME | “尼泊尔标准时间” |
UTC +06:00 | CENTRAL_ASIA_STANDARD_TIME | “中亚北部标准时间” |
UTC +06:00 | BANGLADESH_STANDARD_TIME | “孟加拉标准时间” |
UTC +06:30 | MYANMAR_STANDARD_TIME | “缅甸标准时间” |
UTC +07:00 | N_CENTRAL_ASIA_STANDARD_TIME | “中亚 北部标准时间” |
UTC +07:00 | SE_ASIA_STANDARD_TIME | “东南亚标准时间” |
UTC +07:00 | ALTAI_STANDARD_TIME | “阿尔泰标准时间” |
UTC +07:00 | W_MONGOLIA_STANDARD_TIME | “西 蒙古标准时间” |
UTC +07:00 | NORTH_ASIA_STANDARD_TIME | “北亚标准时间” |
UTC +07:00 | TOMSK_STANDARD_TIME | “托木斯克标准时间” |
UTC +08:00 | CHINA_STANDARD_TIME | “中国标准时间” |
UTC +08:00 | NORTH_ASIA_EAST_STANDARD_TIME | “北亚东部标准时间” |
UTC +08:00 | SINGAPORE_STANDARD_TIME | “新加坡标准时间” |
UTC +08:00 | W_AUSTRALIA_STANDARD_TIME | “澳大利亚 西部标准时间” |
UTC +08:00 | TAIPEI_STANDARD_TIME | “台北标准时间” |
UTC +08:00 | ULAANBAATAR_STANDARD_TIME | “乌兰巴托标准时间” |
UTC +08:45 | AUS_CENTRAL_W_STANDARD_TIME | “澳大利亚中西部标准时间” |
UTC +09:00 | NORTH_KOREA_STANDARD_TIME | “朝鲜标准时间” |
UTC +09:00 | TRANSBAIKAL_STANDARD_TIME | “外贝加尔标准时间” |
UTC +09:00 | TOKYO_STANDARD_TIME | “东京标准时间” |
UTC +09:00 | KOREA_STANDARD_TIME | “韩国标准时间” |
UTC +09:00 | YAKUTSK_STANDARD_TIME | “雅库茨克标准时间” |
UTC +09:30 | CEN_AUSTRALIA_STANDARD_TIME | “中部 澳大利亚标准时间” |
UTC +09:30 | AUS_CENTRAL_STANDARD_TIME | “澳大利亚中部标准时间” |
UTC +10:00 | E_AUSTRALIAN_STANDARD_TIME | “E. 澳大利亚标准时间” |
UTC +10:00 | AUS_EASTERN_STANDARD_TIME | “澳大利亚东部标准时间” |
UTC +10:00 | WEST_PACIFIC_STANDARD_TIME | “太平洋西部标准时间” |
UTC +10:00 | TASMANIA_STANDARD_TIME | “塔斯马尼亚岛标准时间” |
UTC +10:00 | VLADIVOSTOK_STANDARD_TIME | “符拉迪沃斯托克标准时间” |
UTC +10:30 | LORD_HOWE_STANDARD_TIME | “豪勋爵岛标准时间” |
UTC +11:00 | BOUGAINVILLE_STANDARD_TIME | “布干维尔标准时间” |
UTC +11:00 | RUSSIA_TIME_ZONE_10 | “俄罗斯时区 10” |
UTC +11:00 | MAGADAN_STANDARD_TIME | “马加丹标准时间” |
UTC +11:00 | NORFOLK_STANDARD_TIME | “诺福克标准时间” |
UTC +11:00 | SAKHALIN_STANDARD_TIME | “萨哈林标准时间” |
UTC +11:00 | CENTRAL_PACIFIC_STANDARD_TIME | “太平洋中部标准时间” |
UTC +12:00 | RUSSIA_TIME_ZONE_11 | “俄罗斯时区 11” |
UTC +12:00 | NEW_ZEALAND_STANDARD_TIME | “新西兰标准时间” |
UTC +12:00 | UTC_12 | “UTC+12” |
UTC +12:00 | FIJI_STANDARD_TIME | “斐济标准时间” |
UTC +12:00 | KAMCHATKA_STANDARD_TIME | “勘察加标准时间” |
UTC +12:45 | CHATHAM_ISLANDS_STANDARD_TIME | “查塔姆群岛标准时间” |
UTC +13:00 | TONGA__STANDARD_TIME | “汤加标准时间” |
UTC +13:00 | SAMOA_STANDARD_TIME | “萨摩亚标准时间” |
UTC +14:00 | LINE_ISLANDS_STANDARD_TIME | “来恩群岛标准时间” |