Schéma YAML de planification CLI (v2) pour la supervision de modèle (préversion)
S’APPLIQUE À : Extension ml Azure CLI v2 (actuelle)
La syntaxe YAML détaillée dans ce document est basée sur le schéma JSON pour la dernière version de l’extension ML CLI v2. Le fonctionnement de cette syntaxe est garanti uniquement avec la dernière version de l’extension ML CLI v2. Le schéma JSON complet peut être consulté à l’adresse https://azuremlschemas.azureedge.net/latest/monitorSchedule.schema.json. Vous trouverez les schémas des versions d’extension plus anciennes sur https://azuremlschemasprod.azureedge.net/.
Syntaxe YAML
Clé | Type | Description | Valeurs autorisées |
---|---|---|---|
$schema |
string | Schéma YAML. | |
name |
string | Obligatoire. Nom de la planification. | |
description |
string | Description de la planification. | |
tags |
object | Dictionnaire d’étiquettes de la planification. | |
trigger |
object | Obligatoire. Configuration du déclencheur pour définir la règle précisant quand déclencher un travail. RecurrenceTrigger ou CronTrigger est obligatoire. |
|
create_monitor |
object | Obligatoire. Définition de la supervision qui sera déclenchée par une planification. MonitorDefinition est obligatoire. |
Configuration de déclencheur
Déclencheur recurrence
Clé | Type | Description | Valeurs autorisées |
---|---|---|---|
type |
string | Obligatoire. Spécifie le type de planification. | recurrence |
frequency |
string | Obligatoire. Spécifie l’unité de temps qui décrit la fréquence à laquelle la planification se déclenche. | minute , , hour day , , week month |
interval |
entier | Obligatoire. Spécifie l’intervalle de déclenchement de la planification. | |
start_time |
string | Décrit la date et l’heure de début avec le fuseau horaire. Si start_time est omis, le premier travail s’exécute instantanément et les travaux ultérieurs sont déclenchés en fonction de la planification, autrement dit start_time est égal à l’heure de création du travail. Si l’heure de début est dans le passé, la première charge de travail est exécutée à l’heure d’exécution calculée suivante. |
|
end_time |
string | Décrit la date et l’heure de fin avec le fuseau horaire. Si end_time est omis, la planification continue à s’exécuter jusqu’à ce qu’elle soit explicitement désactivée. |
|
timezone |
string | Spécifie le fuseau horaire de la périodicité. S’il est omis, la valeur par défaut est UTC. | Consultez l’annexe pour connaître les valeurs de fuseau horaire. |
pattern |
object | Spécifie le modèle de la périodicité. Si le modèle est omis, le ou les travaux sont déclenchés en fonction de la logique de start_time, de la fréquence et de l’intervalle. |
Planification de périodicité
La planification de périodicité définit le modèle de périodicité, contenant hours
, minutes
et weekdays
.
- Quand la fréquence est
day
, le modèle peut spécifierhours
etminutes
. - Quand la fréquence est
week
etmonth
, le modèle peut spécifierhours
,minutes
etweekdays
.
Clé | Type | Valeurs autorisées |
---|---|---|
hours |
entier ou tableau d’entiers | 0-23 |
minutes |
entier ou tableau d’entiers | 0-59 |
week_days |
chaîne ou tableau de chaînes | monday , tuesday , , thursday wednesday , friday , , saturday ,sunday |
CronTrigger
Clé | Type | Description | Valeurs autorisées |
---|---|---|---|
type |
string | Obligatoire. Spécifie le type de planification. | cron |
expression |
string | Obligatoire. Spécifie l’expression cron pour définir comment déclencher les travaux. L’expression utilise l’expression crontab standard pour exprimer une planification périodique. Une expression unique est composée de cinq champs délimités par l’espace :MINUTES HOURS DAYS MONTHS DAYS-OF-WEEK |
|
start_time |
string | Décrit la date et l’heure de début avec le fuseau horaire. Si start_time est omis, le premier travail s’exécute instantanément et les travaux ultérieurs seront déclenchés en fonction de la planification, autrement dit start_time sera égal à l’heure de création du travail. Si l’heure de début est dans le passé, la première charge de travail est exécutée à l’heure d’exécution calculée suivante. | |
end_time |
string | Décrit la date et l’heure de fin avec le fuseau horaire. Si end_time est omis, la planification continue à s’exécuter jusqu’à ce qu’elle soit explicitement désactivée. | |
timezone |
string | Spécifie le fuseau horaire de la périodicité. S’il est omis, la valeur par défaut est UTC. | Consultez l’annexe pour connaître les valeurs de fuseau horaire. |
Définition de la supervision
Clé | Type | Description | Valeurs autorisées | Valeur par défaut |
---|---|---|---|---|
compute |
Object | Requis. Description des ressources de calcul permettant au pool Spark d’exécuter le travail de supervision. | ||
compute.instance_type |
String | Requis. Type d’instance de calcul à utiliser pour le pool Spark. | « standard_e4s_v3 », « standard_e8s_v3 », « standard_e16s_v3 », « standard_e32s_v3 », « standard_e64s_v3 » | n/a |
compute.runtime_version |
String | Facultatif. Définit la version du runtime Spark. | 3.3 |
3.3 |
monitoring_target |
Object | Ressource(s) Azure Machine Learning associée(s) à la supervision de modèle. | ||
monitoring_target.ml_task |
String | Tâche Machine Learning pour le modèle. | Les valeurs autorisées sont : classification , regression , question_answering |
|
monitoring_target.endpoint_deployment_id |
String | Facultatif. ID de point de terminaison/déploiement Azure Machine Learning associé au format azureml:myEndpointName:myDeploymentName . Ce champ est obligatoire si votre point de terminaison/déploiement a activé l’utilisation de la collecte de données du modèle pour la supervision de modèle. |
||
monitoring_target.model_id |
String | Facultatif. ID de modèle associé pour la supervision de modèle. | ||
monitoring_signals |
Object | Dictionnaire des signaux de supervision à inclure. La clé est un nom pour le signal de supervision dans le contexte de supervision et la valeur est un objet contenant une spécification de signal de supervision. Facultatif pour la supervision de modèle de base qui utilise des données de production récentes comme ligne de base de comparaison et qui comporte 3 signaux de supervision : dérive des données, dérive de prédiction et qualité des données. | ||
alert_notification |
Chaîne ou Objet | Description des destinataires de la notification d’alerte. | L’une des deux destinations d’alerte est autorisée : azmonitoring de chaîne ou emails d’objet contenant un tableau de destinataires d’e-mail |
|
alert_notification.emails |
Objet | Liste des adresses e-mail de réception de la notification d’alerte. |
Signaux de supervision
Dérive de données
À mesure que les données utilisées pour entraîner le modèle évoluent en production, la distribution des données peut changer, ce qui entraîne une discordance entre les données d’apprentissage et les données réelles que le modèle a l’habitude de prédire. La dérive des données est un phénomène qui se produit dans l’apprentissage automatique quand les propriétés statistiques des données d’entrée utilisées pour l’apprentissage du modèle changent au fil du temps.
Clé | Type | Description | Valeurs autorisées | Valeur par défaut |
---|---|---|---|---|
type |
String | Requis. Type de signal de supervision. Le composant prédéfini de traitement du signal de supervision est automatiquement chargé selon le type spécifié ici. |
data_drift |
data_drift |
production_data |
Object | Facultatif. Description des données de production à analyser pour le signal de supervision. | ||
production_data.input_data |
Object | Facultatif. Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
production_data.data_context |
String | Contexte des données, qui fait référence aux données de production de modèle. Il peut s’agir d’entrées ou de sorties de modèle | model_inputs |
|
production_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés production_data.data_window.lookback_window_offset et production_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés production_data.data_window.window_start et production_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
production_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si production_data.data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
reference_data |
Object | Facultatif. Les données de production récentes sont utilisées comme données de ligne de base de comparaison, si ce n’est pas spécifié. Il est recommandé d’utiliser les données d’apprentissage comme ligne de base de comparaison. | ||
reference_data.input_data |
Object | Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
reference_data.data_context |
String | Contexte des données, qui fait référence au contexte dans lequel le jeu de données a été utilisé auparavant. | model_inputs , , training test , ,validation |
|
reference_data.data_column_names.target_column |
Objet | Facultatif. Si la valeur est des reference_data données d’apprentissage, cette propriété est requise pour surveiller les principales fonctionnalités N pour la dérive des données. |
||
reference_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés reference_data.data_window.lookback_window_offset et reference_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés reference_data.data_window.window_start et reference_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
reference_data_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si reference_data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
features |
Object | Facultatif. Caractéristiques cibles à superviser pour la dérive des données. Certains modèles peuvent avoir des centaines ou des milliers de caractéristiques. Il est toujours recommandé de spécifier les caractéristiques utiles pour la supervision. | L’une des valeurs suivantes : liste des noms de caractéristiques, features.top_n_feature_importance ou all_features |
Par défaut, features.top_n_feature_importance = 10 si production_data.data_context est training . Sinon, la valeur par défaut est all_features |
alert_enabled |
Booléen | Permet d’activer/désactiver la notification d’alerte pour le signal de supervision. True ou False |
||
metric_thresholds |
Object | Liste des propriétés des métriques et des seuils pour le signal de supervision. Quand le seuil est dépassé et si alert_enabled est true , l’utilisateur reçoit une notification d’alerte. |
||
metric_thresholds.numerical |
Objet | facultatif. La liste des métriques et des seuils au format key:value , key est le nom de la métrique, value est le seuil. |
Noms de métriques numériques autorisés : jensen_shannon_distance , normalized_wasserstein_distance , population_stability_index , two_sample_kolmogorov_smirnov_test |
|
metric_thresholds.categorical |
Objet | facultatif. Liste des métriques et des seuils au format « key:value », « key » est le nom de la métrique, « value » est le seuil. | Noms de métriques catégorielles autorisés : jensen_shannon_distance , chi_squared_test , population_stability_index |
Dérive de prédiction
La dérive de prédiction suit les changements dans la distribution des sorties de prédiction d’un modèle en les comparant à des données étiquetées de validation ou de test ou à des données de production récentes.
Clé | Type | Description | Valeurs autorisées | Valeur par défaut |
---|---|---|---|---|
type |
String | Requis. Type de signal de supervision. Le composant prédéfini de traitement du signal de supervision est automatiquement chargé selon le type spécifié ici. |
prediction_drift |
prediction_drift |
production_data |
Object | Facultatif. Description des données de production à analyser pour le signal de supervision. | ||
production_data.input_data |
Object | Facultatif. Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
production_data.data_context |
String | Contexte des données, qui fait référence aux données de production de modèle. Il peut s’agir d’entrées ou de sorties de modèle | model_outputs |
|
production_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés production_data.data_window.lookback_window_offset et production_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés production_data.data_window.window_start et production_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
production_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cela est obligatoire si production_data.data.input_data.type c’est le cas uri_folder . Pour plus d’informations sur la spécification du composant de prétraitement, consultez la spécification du composant de prétraitement. |
||
reference_data |
Objet | Facultatif. Les données de production récentes sont utilisées comme données de ligne de base de comparaison, si ce n’est pas spécifié. Il est recommandé d’utiliser les données d’apprentissage comme ligne de base de comparaison. | ||
reference_data.input_data |
Object | Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
reference_data.data_context |
String | Contexte des données, qui fait référence au contexte dans lequel le jeu de données a été utilisé auparavant. | model_inputs , , training test , ,validation |
|
reference_data.data_column_names.target_column |
Objet | Facultatif. Si le « reference_data » est constitué de données de formation, cette propriété est requise pour surveiller les N principales fonctionnalités pour la dérive de données. | ||
reference_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés reference_data.data_window.lookback_window_offset et reference_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés reference_data.data_window.window_start et reference_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
reference_data_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si reference_data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
features |
Object | Facultatif. Caractéristiques cibles à superviser pour la dérive des données. Certains modèles peuvent avoir des centaines ou des milliers de caractéristiques. Il est toujours recommandé de spécifier les caractéristiques utiles pour la supervision. | L’une des valeurs suivantes : liste des noms de caractéristiques, features.top_n_feature_importance ou all_features |
Par défaut, features.top_n_feature_importance = 10 si production_data.data_context est training . Sinon, la valeur par défaut est all_features |
alert_enabled |
Booléen | Permet d’activer/désactiver la notification d’alerte pour le signal de supervision. True ou False |
||
metric_thresholds |
Object | Liste des propriétés des métriques et des seuils pour le signal de supervision. Quand le seuil est dépassé et si alert_enabled est true , l’utilisateur reçoit une notification d’alerte. |
||
metric_thresholds.numerical |
Objet | facultatif. Liste des métriques et des seuils au format « key:value », « key » est le nom de la métrique, « value » est le seuil. | Noms de métriques numériques autorisés : jensen_shannon_distance , normalized_wasserstein_distance , population_stability_index , two_sample_kolmogorov_smirnov_test |
|
metric_thresholds.categorical |
Objet | facultatif. Liste des métriques et des seuils au format « key:value », « key » est le nom de la métrique, « value » est le seuil. | Noms de métriques catégorielles autorisés : jensen_shannon_distance , chi_squared_test , population_stability_index |
Qualité des données
Le signal de qualité des données suit les problèmes de qualité des données en production en les comparant aux données d’apprentissage ou aux données de production récentes.
Clé | Type | Description | Valeurs autorisées | Valeur par défaut |
---|---|---|---|---|
type |
String | Requis. Type de signal de supervision. Le composant prédéfini de traitement du signal de supervision est automatiquement chargé selon le type spécifié ici. |
data_quality |
data_quality |
production_data |
Object | Facultatif. Description des données de production à analyser pour le signal de supervision. | ||
production_data.input_data |
Object | Facultatif. Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
production_data.data_context |
String | Contexte des données, qui fait référence aux données de production de modèle. Il peut s’agir d’entrées ou de sorties de modèle | model_inputs , model_outputs |
|
production_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés production_data.data_window.lookback_window_offset et production_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés production_data.data_window.window_start et production_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
production_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si production_data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
reference_data |
Object | Facultatif. Les données de production récentes sont utilisées comme données de ligne de base de comparaison, si ce n’est pas spécifié. Il est recommandé d’utiliser les données d’apprentissage comme ligne de base de comparaison. | ||
reference_data.input_data |
Object | Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
reference_data.data_context |
String | Contexte des données, qui fait référence au contexte dans lequel le jeu de données a été utilisé auparavant. | model_inputs , , model_outputs training , , test validation |
|
reference_data.data_column_names.target_column |
Objet | Facultatif. Si le « reference_data » est constitué de données de formation, cette propriété est requise pour surveiller les N principales fonctionnalités pour la dérive de données. | ||
reference_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés reference_data.data_window.lookback_window_offset et reference_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés reference_data.data_window.window_start et reference_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
reference_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si reference_data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
features |
Object | Facultatif. Caractéristiques cibles à superviser pour la qualité des données. Certains modèles peuvent avoir des centaines ou des milliers de caractéristiques. Il est toujours recommandé de spécifier les caractéristiques utiles pour la supervision. | L’une des valeurs suivantes : liste des noms de caractéristiques, features.top_n_feature_importance ou all_features |
Par défaut, features.top_n_feature_importance = 10 si reference_data.data_context est training . Sinon, la valeur par défaut est all_features |
alert_enabled |
Booléen | Permet d’activer/désactiver la notification d’alerte pour le signal de supervision. True ou False |
||
metric_thresholds |
Object | Liste des propriétés des métriques et des seuils pour le signal de supervision. Quand le seuil est dépassé et si alert_enabled est true , l’utilisateur reçoit une notification d’alerte. |
||
metric_thresholds.numerical |
Objet | Facultatif La liste des métriques et des seuils au format key:value , key est le nom de la métrique, value est le seuil. |
Noms de métriques numériques autorisés : data_type_error_rate , null_value_rate , out_of_bounds_rate |
|
metric_thresholds.categorical |
Objet | Facultatif La liste des métriques et des seuils au format key:value , key est le nom de la métrique, value est le seuil. |
Noms de métriques catégorielles autorisés : data_type_error_rate , null_value_rate , out_of_bounds_rate |
Dérive d’attribution de caractéristiques (préversion)
L’attribution de caractéristiques d’un modèle peut changer au fil du temps en raison de modifications de la distribution des données, de modifications des relations entre les caractéristiques ou de modifications du problème sous-jacent en cours de résolution. La dérive d’attribution de caractéristiques est un phénomène qui se produit dans les modèles Machine Learning quand l’importance ou la contribution des caractéristiques à la sortie de prédiction change au fil du temps.
Clé | Type | Description | Valeurs autorisées | Valeur par défaut |
---|---|---|---|---|
type |
String | Requis. Type de signal de supervision. Le composant prédéfini de traitement du signal de supervision est automatiquement chargé selon le type spécifié ici. |
feature_attribution_drift |
feature_attribution_drift |
production_data |
Tableau | Facultatif, valeur par défaut pour collecter les données associées au point de terminaison Azure Machine Learning si ce n’est pas fourni. Le production_data est une liste de jeux de données et de métadonnées associées, qui doit inclure à la fois les données d’entrées et de sortie du modèle. Il peut s’agir d’un seul jeu de données contenant à la fois les entrées et les sorties du modèle, ou de deux jeux de données distincts contenant l’un les entrées et l’autre les sorties du modèle. |
||
production_data.input_data |
Objet | Facultatif. Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
production_data.input_data.data_column_names |
Object | Nom de colonne de corrélation et noms de colonnes de prédiction au format key:value , requis pour la jointure de données. |
Les clés autorisées sont les suivantes : correlation_id , target_column |
|
production_data.data_context |
Chaîne | Contexte des données. Il fait référence aux données d’entrée du modèle de production. | model_inputs , , model_outputs model_inputs_outputs |
|
production_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés production_data.data_window.lookback_window_offset et production_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés production_data.data_window.window_start et production_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
production_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si production_data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
production_data.data_window_size |
String | Facultatif. Taille de la fenêtre de données en jours au format ISO8601, par exemple P7D . Il s’agit de la fenêtre de données de production à calculer pour les problèmes de qualité des données. |
Par défaut, la taille de la fenêtre de données est la dernière période de supervision. | |
reference_data |
Object | Facultatif. Les données de production récentes sont utilisées comme données de ligne de base de comparaison, si ce n’est pas spécifié. Il est recommandé d’utiliser les données d’apprentissage comme ligne de base de comparaison. | ||
reference_data.input_data |
Object | Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
reference_data.data_context |
String | Contexte des données, qui fait référence au contexte dans lequel le jeu de données a été utilisé auparavant. Pour la dérive d’attribution de fonctionnalités, seules les données training sont autorisées. |
training |
|
reference_data.data_column_names.target_column |
String | Obligatoire. | ||
reference_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés reference_data.data_window.lookback_window_offset et reference_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés reference_data.data_window.window_start et reference_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
reference_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si reference_data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
alert_enabled |
Booléen | Permet d’activer/désactiver la notification d’alerte pour le signal de supervision. True ou False |
||
metric_thresholds |
Objet | Nom de métrique et seuil pour la dérive d’attribution des fonctionnalités au format key:value , où key est le nom de la métrique et value le seuil. Quand le seuil est dépassé et si alert_enabled est activé, l’utilisateur reçoit une notification d’alerte. |
Nom de métrique autorisé : normalized_discounted_cumulative_gain |
Signal de surveillance personnalisé
Signal de supervision personnalisé via un composant Azure Machine Learning personnalisé.
Clé | Type | Description | Valeurs autorisées | Valeur par défaut |
---|---|---|---|---|
type |
String | Requis. Type de signal de supervision. Le composant prédéfini de traitement du signal de supervision est automatiquement chargé selon le type spécifié ici. |
custom |
custom |
component_id |
Chaîne | Obligatoire. ID du composant Azure Machine Learning correspondant à votre signal personnalisé. Par exemple, azureml:mycustomcomponent:1 |
||
input_data |
Objet | Facultatif. Description des données d’entrée à analyser par le signal de surveillance, consultez la spécification des données d’entrée de travail . | ||
input_data.<data_name>.data_context |
Chaîne | Contexte des données, qui fait référence aux données de production de modèle. Il peut s’agir d’entrées ou de sorties de modèle | model_inputs |
|
input_data.<data_name>.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés input_data.<data_name>.data_window.lookback_window_offset et input_data.<data_name>.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés input_data.<data_name>.data_window.window_start et input_data.<data_name>.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
input_data.<data_name>.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si input_data.<data_name>.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
alert_enabled |
Booléen | Permet d’activer/désactiver la notification d’alerte pour le signal de supervision. True ou False |
||
metric_thresholds.metric_name |
Object | Nom de la métrique personnalisée. | ||
threshold |
Object | Seuil acceptable pour la métrique personnalisée. |
Performances des modèles (préversion)
Les performances du modèle suivent les performances objectives de la sortie d’un modèle en production en la comparant aux données de vérité de terrain collectées.
Clé | Type | Description | Valeurs autorisées | Valeur par défaut |
---|---|---|---|---|
type |
String | Requis. Type de signal de supervision. Le composant prédéfini de traitement du signal de supervision est automatiquement chargé selon le type spécifié ici. |
model_performance |
model_performance |
production_data |
Tableau | Facultatif, valeur par défaut pour collecter les données associées au point de terminaison Azure Machine Learning si ce n’est pas fourni. Le production_data est une liste de jeux de données et de métadonnées associées, qui doit inclure à la fois les données d’entrées et de sortie du modèle. Il peut s’agir d’un seul jeu de données contenant à la fois les entrées et les sorties du modèle, ou de deux jeux de données distincts contenant l’un les entrées et l’autre les sorties du modèle. |
||
production_data.input_data |
Objet | Facultatif. Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
production_data.input_data.data_column_names |
Object | Nom de colonne de corrélation et noms de colonnes de prédiction au format key:value , requis pour la jointure de données. |
Les clés autorisées sont les suivantes : correlation_id , target_column |
|
production_data.data_context |
Chaîne | Contexte des données. Il fait référence aux données d’entrée du modèle de production. | model_inputs , , model_outputs model_inputs_outputs |
|
production_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés production_data.data_window.lookback_window_offset et production_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés production_data.data_window.window_start et production_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
production_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si production_data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
production_data.data_window_size |
String | Facultatif. Taille de la fenêtre de données en jours au format ISO8601, par exemple P7D . Il s’agit de la fenêtre de données de production à calculer pour les problèmes de qualité des données. |
Par défaut, la taille de la fenêtre de données est la dernière période de supervision. | |
reference_data |
Object | Facultatif. Les données de production récentes sont utilisées comme données de ligne de base de comparaison, si ce n’est pas spécifié. Il est recommandé d’utiliser les données d’apprentissage comme ligne de base de comparaison. | ||
reference_data.input_data |
Object | Description de la source de données d’entrée. Consultez la spécification des données d’entrée de travail. | ||
reference_data.data_context |
String | Contexte des données, qui fait référence au contexte dans lequel le jeu de données a été utilisé auparavant. Pour la dérive d’attribution de fonctionnalités, seules les données training sont autorisées. |
training |
|
reference_data.data_column_names.target_column |
String | Obligatoire. | ||
reference_data.data_window |
Objet | Facultatif. Fenêtre de données des données de référence à utiliser comme données de base pour la comparaison. | Autorisez soit la fenêtre de données propagée, soit la fenêtre de données fixe uniquement. Pour utiliser la fenêtre de données propagée, veuillez spécifier les propriétés reference_data.data_window.lookback_window_offset et reference_data.data_window.lookback_window_size . Pour utiliser des fenêtres de données fixes, veuillez spécifier les propriétés reference_data.data_window.window_start et reference_data.data_window.window_end . Toutes les valeurs de propriété doivent être au format ISO8601. |
|
reference_data.pre_processing_component |
Chaîne | ID de composant au format azureml:myPreprocessing@latest pour un composant inscrit. Cet élément est obligatoire si reference_data.input_data.type est uri_folder . Consultez la spécification du composant de prétraitement. |
||
alert_enabled |
Booléen | Permet d’activer/désactiver la notification d’alerte pour le signal de supervision. True ou False |
||
metric_thresholds.classification |
Object | Facultatif La liste des métriques et des seuils au format key:value , key est le nom de la métrique, value est le seuil. |
Noms de métrique classification autorisés : accuracy , precision , recall |
|
metric_thresholds.regression |
Object | Facultatif La liste des métriques et des seuils au format key:value , key est le nom de la métrique, value est le seuil. |
Noms de métrique regression autorisés : mae , mse , rmse |
Notes
La commande az ml schedule
peut être utilisée pour gérer les modèles Azure Machine Learning.
Exemples
Les exemples cli de supervision sont disponibles dans les exemples de référentiel GitHub. En voici quelques-uns :
YAML : Moniteur out-of-box
S’APPLIQUE À : Extension ml Azure CLI v2 (actuelle)
# out-of-box-monitoring.yaml
$schema: http://azureml/sdk-2-0/Schedule.json
name: credit_default_model_monitoring
display_name: Credit default model monitoring
description: Credit default model monitoring setup with minimal configurations
trigger:
# perform model monitoring activity daily at 3:15am
type: recurrence
frequency: day #can be minute, hour, day, week, month
interval: 1 # #every day
schedule:
hours: 3 # at 3am
minutes: 15 # at 15 mins after 3am
create_monitor:
compute: # specify a spark compute for monitoring job
instance_type: standard_e4s_v3
runtime_version: "3.3"
monitoring_target:
ml_task: classification # model task type: [classification, regression, question_answering]
endpoint_deployment_id: azureml:credit-default:main # azureml endpoint deployment id
alert_notification: # emails to get alerts
emails:
- abc@example.com
- def@example.com
YAML : Moniteur avancé
S’APPLIQUE À : Extension ml Azure CLI v2 (actuelle)
# advanced-model-monitoring.yaml
$schema: http://azureml/sdk-2-0/Schedule.json
name: fraud_detection_model_monitoring
display_name: Fraud detection model monitoring
description: Fraud detection model monitoring with advanced configurations
trigger:
# perform model monitoring activity daily at 3:15am
type: recurrence
frequency: day #can be minute, hour, day, week, month
interval: 1 # #every day
schedule:
hours: 3 # at 3am
minutes: 15 # at 15 mins after 3am
create_monitor:
compute:
instance_type: standard_e4s_v3
runtime_version: "3.3"
monitoring_target:
ml_task: classification
endpoint_deployment_id: azureml:credit-default:main
monitoring_signals:
advanced_data_drift: # monitoring signal name, any user defined name works
type: data_drift
# reference_dataset is optional. By default referece_dataset is the production inference data associated with Azure Machine Learning online endpoint
reference_data:
input_data:
path: azureml:credit-reference:1 # use training data as comparison reference dataset
type: mltable
data_context: training
data_column_names:
target_column: DEFAULT_NEXT_MONTH
features:
top_n_feature_importance: 10 # monitor drift for top 10 features
metric_thresholds:
numerical:
jensen_shannon_distance: 0.01
categorical:
pearsons_chi_squared_test: 0.02
advanced_data_quality:
type: data_quality
# reference_dataset is optional. By default reference_dataset is the production inference data associated with Azure Machine Learning online endpoint
reference_data:
input_data:
path: azureml:credit-reference:1
type: mltable
data_context: training
features: # monitor data quality for 3 individual features only
- SEX
- EDUCATION
metric_thresholds:
numerical:
null_value_rate: 0.05
categorical:
out_of_bounds_rate: 0.03
feature_attribution_drift_signal:
type: feature_attribution_drift
# production_data: is not required input here
# Please ensure Azure Machine Learning online endpoint is enabled to collected both model_inputs and model_outputs data
# Azure Machine Learning model monitoring will automatically join both model_inputs and model_outputs data and used it for computation
reference_data:
input_data:
path: azureml:credit-reference:1
type: mltable
data_context: training
data_column_names:
target_column: DEFAULT_NEXT_MONTH
metric_thresholds:
normalized_discounted_cumulative_gain: 0.9
alert_notification:
emails:
- abc@example.com
- def@example.com
Annexe
Fuseau horaire
La planification actuelle prend en charge les fuseaux horaires suivants. La clé peut être utilisée directement dans le SDK Python, tandis que la valeur peut être utilisée dans le travail YAML. Le tableau est organisé par UTC (Temps universel coordonné).
UTC | Clé | Valeur |
---|---|---|
UTC -12:00 | DATELINE_STANDARD_TIME | "Dateline Standard Time" |
UTC -11:00 | UTC_11 | "UTC-11" |
UTC - 10:00 | ALEUTIAN_STANDARD_TIME | Heure standard des îles Aléoutiennes |
UTC - 10:00 | HAWAIIAN_STANDARD_TIME | "Hawaiian Standard Time" |
UTC -09:30 | MARQUESAS_STANDARD_TIME | "Marquesas Standard Time" |
UTC -09:00 | ALASKAN_STANDARD_TIME | "Alaskan Standard Time" |
UTC -09:00 | UTC_09 | "UTC-09" |
UTC -08:00 | PACIFIC_STANDARD_TIME_MEXICO | "Pacific Standard Time (Mexico)" |
UTC -08:00 | UTC_08 | "UTC-08" |
UTC -08:00 | PACIFIC_STANDARD_TIME | "Pacific Standard Time" |
UTC -07:00 | US_MOUNTAIN_STANDARD_TIME | "US Mountain Standard Time" |
UTC -07:00 | MOUNTAIN_STANDARD_TIME_MEXICO | "Mountain Standard Time (Mexico)" |
UTC -07:00 | MOUNTAIN_STANDARD_TIME | "Mountain Standard Time" |
UTC -06:00 | CENTRAL_AMERICA_STANDARD_TIME | "Central America Standard Time" |
UTC -06:00 | CENTRAL_STANDARD_TIME | "Central Standard Time" |
UTC -06:00 | EASTER_ISLAND_STANDARD_TIME | "Easter Island Standard Time" |
UTC -06:00 | CENTRAL_STANDARD_TIME_MEXICO | "Central Standard Time (Mexico)" |
UTC -06:00 | CANADA_CENTRAL_STANDARD_TIME | "Canada Central Standard Time" |
UTC -05:00 | SA_PACIFIC_STANDARD_TIME | "SA Pacific Standard Time" |
UTC -05:00 | EASTERN_STANDARD_TIME_MEXICO | "Eastern Standard Time (Mexico)" |
UTC -05:00 | EASTERN_STANDARD_TIME | "Eastern Standard Time" |
UTC -05:00 | HAITI_STANDARD_TIME | "Haiti Standard Time" |
UTC -05:00 | CUBA_STANDARD_TIME | "Cuba Standard Time" |
UTC -05:00 | US_EASTERN_STANDARD_TIME | "US Eastern Standard Time" |
UTC -05:00 | TURKS_AND_CAICOS_STANDARD_TIME | "Turks And Caicos Standard Time" |
UTC -04:00 | PARAGUAY_STANDARD_TIME | "Paraguay Standard Time" |
UTC -04:00 | ATLANTIC_STANDARD_TIME | "Atlantic Standard Time" |
UTC -04:00 | VENEZUELA_STANDARD_TIME | "Venezuela Standard Time" |
UTC -04:00 | CENTRAL_BRAZILIAN_STANDARD_TIME | "Central Brazilian Standard Time" |
UTC -04:00 | SA_WESTERN_STANDARD_TIME | "SA Western Standard Time" |
UTC -04:00 | PACIFIC_SA_STANDARD_TIME | "Pacific SA Standard Time" |
UTC -03:30 | NEWFOUNDLAND_STANDARD_TIME | "Newfoundland Standard Time" |
UTC -03:00 | TOCANTINS_STANDARD_TIME | "Tocantins Standard Time" |
UTC -03:00 | E_SOUTH_AMERICAN_STANDARD_TIME | "E. South America Standard Time" |
UTC -03:00 | SA_EASTERN_STANDARD_TIME | "SA Eastern Standard Time" |
UTC -03:00 | ARGENTINA_STANDARD_TIME | "Argentina Standard Time" |
UTC -03:00 | GREENLAND_STANDARD_TIME | "Greenland Standard Time" |
UTC -03:00 | MONTEVIDEO_STANDARD_TIME | "Montevideo Standard Time" |
UTC -03:00 | SAINT_PIERRE_STANDARD_TIME | "Saint Pierre Standard Time" |
UTC -03:00 | BAHIA_STANDARD_TIM | "Bahia Standard Time" |
UTC -02:00 | UTC_02 | "UTC-02" |
UTC -02:00 | MID_ATLANTIC_STANDARD_TIME | "Mid-Atlantic Standard Time" |
UTC -01:00 | AZORES_STANDARD_TIME | "Azores Standard Time" |
UTC -01:00 | CAPE_VERDE_STANDARD_TIME | "Cape Verde Standard Time" |
UTC | UTC | UTC |
UTC +00:00 | GMT_STANDARD_TIME | "GMT Standard Time" |
UTC +00:00 | GREENWICH_STANDARD_TIME | "Greenwich Standard Time" |
UTC +01:00 | MOROCCO_STANDARD_TIME | "Morocco Standard Time" |
UTC +01:00 | W_EUROPE_STANDARD_TIME | "W. Europe Standard Time" |
UTC +01:00 | CENTRAL_EUROPE_STANDARD_TIME | "Central Europe Standard Time" |
UTC +01:00 | ROMANCE_STANDARD_TIME | "Romance Standard Time" |
UTC +01:00 | CENTRAL_EUROPEAN_STANDARD_TIME | "Central European Standard Time" |
UTC +01:00 | W_CENTRAL_AFRICA_STANDARD_TIME | "W. Central Africa Standard Time" |
UTC +02:00 | NAMIBIA_STANDARD_TIME | "Namibia Standard Time" |
UTC +02:00 | JORDAN_STANDARD_TIME | "Jordan Standard Time" |
UTC +02:00 | GTB_STANDARD_TIME | "GTB Standard Time" |
UTC +02:00 | MIDDLE_EAST_STANDARD_TIME | "Middle East Standard Time" |
UTC +02:00 | EGYPT_STANDARD_TIME | "Egypt Standard Time" |
UTC +02:00 | E_EUROPE_STANDARD_TIME | "E. Europe Standard Time" |
UTC +02:00 | SYRIA_STANDARD_TIME | "Syria Standard Time" |
UTC +02:00 | WEST_BANK_STANDARD_TIME | "West Bank Standard Time" |
UTC +02:00 | SOUTH_AFRICA_STANDARD_TIME | "South Africa Standard Time" |
UTC +02:00 | FLE_STANDARD_TIME | "FLE Standard Time" |
UTC +02:00 | ISRAEL_STANDARD_TIME | "Israel Standard Time" |
UTC +02:00 | KALININGRAD_STANDARD_TIME | "Kaliningrad Standard Time" |
UTC +02:00 | LIBYA_STANDARD_TIME | "Libya Standard Time" |
UTC +03:00 | TÜRKIYE_STANDARD_TIME | « Heure standard de la Turquie » |
UTC +03:00 | ARABIC_STANDARD_TIME | "Arabic Standard Time" |
UTC +03:00 | ARAB_STANDARD_TIME | "Arab Standard Time" |
UTC +03:00 | BELARUS_STANDARD_TIME | "Belarus Standard Time" |
UTC +03:00 | RUSSIAN_STANDARD_TIME | "Russian Standard Time" |
UTC +03:00 | E_AFRICA_STANDARD_TIME | "E. Africa Standard Time" |
UTC +03:30 | IRAN_STANDARD_TIME | "Iran Standard Time" |
UTC +04:00 | ARABIAN_STANDARD_TIME | "Arabian Standard Time" |
UTC +04:00 | ASTRAKHAN_STANDARD_TIME | "Astrakhan Standard Time" |
UTC +04:00 | AZERBAIJAN_STANDARD_TIME | "Azerbaijan Standard Time" |
UTC +04:00 | RUSSIA_TIME_ZONE_3 | "Russia Time Zone 3" |
UTC +04:00 | MAURITIUS_STANDARD_TIME | "Mauritius Standard Time" |
UTC +04:00 | GEORGIAN_STANDARD_TIME | "Georgian Standard Time" |
UTC +04:00 | CAUCASUS_STANDARD_TIME | "Caucasus Standard Time" |
UTC +04:30 | AFGHANISTAN_STANDARD_TIME | "Afghanistan Standard Time" |
UTC +05:00 | WEST_ASIA_STANDARD_TIME | "West Asia Standard Time" |
UTC +05:00 | EKATERINBURG_STANDARD_TIME | "Ekaterinburg Standard Time" |
UTC +05:00 | PAKISTAN_STANDARD_TIME | "Pakistan Standard Time" |
UTC +05:30 | INDIA_STANDARD_TIME | "India Standard Time" |
UTC +05:30 | SRI_LANKA_STANDARD_TIME | "Sri Lanka Standard Time" |
UTC +05:45 | NEPAL_STANDARD_TIME | "Nepal Standard Time" |
UTC +06:00 | CENTRAL_ASIA_STANDARD_TIME | "Central Asia Standard Time" |
UTC +06:00 | BANGLADESH_STANDARD_TIME | "Bangladesh Standard Time" |
UTC +06:30 | MYANMAR_STANDARD_TIME | "Myanmar Standard Time" |
UTC +07:00 | N_CENTRAL_ASIA_STANDARD_TIME | "N. Central Asia Standard Time" |
UTC +07:00 | SE_ASIA_STANDARD_TIME | "SE Asia Standard Time" |
UTC +07:00 | ALTAI_STANDARD_TIME | "Altai Standard Time" |
UTC +07:00 | W_MONGOLIA_STANDARD_TIME | "W. Mongolia Standard Time" |
UTC +07:00 | NORTH_ASIA_STANDARD_TIME | "North Asia Standard Time" |
UTC +07:00 | TOMSK_STANDARD_TIME | "Tomsk Standard Time" |
UTC +08:00 | CHINA_STANDARD_TIME | "China Standard Time" |
UTC +08:00 | NORTH_ASIA_EAST_STANDARD_TIME | "North Asia East Standard Time" |
UTC +08:00 | SINGAPORE_STANDARD_TIME | "Singapore Standard Time" |
UTC +08:00 | W_AUSTRALIA_STANDARD_TIME | "W. Australia Standard Time" |
UTC +08:00 | TAIPEI_STANDARD_TIME | "Taipei Standard Time" |
UTC +08:00 | ULAANBAATAR_STANDARD_TIME | "Ulaanbaatar Standard Time" |
UTC +08:45 | AUS_CENTRAL_W_STANDARD_TIME | "Aus Central W. Standard Time" |
UTC +09:00 | NORTH_KOREA_STANDARD_TIME | "North Korea Standard Time" |
UTC +09:00 | TRANSBAIKAL_STANDARD_TIME | "Transbaikal Standard Time" |
UTC +09:00 | TOKYO_STANDARD_TIME | "Tokyo Standard Time" |
UTC +09:00 | KOREA_STANDARD_TIME | "Korea Standard Time" |
UTC +09:00 | YAKUTSK_STANDARD_TIME | "Yakutsk Standard Time" |
UTC +09:30 | CEN_AUSTRALIA_STANDARD_TIME | "Cen. Australia Standard Time" |
UTC +09:30 | AUS_CENTRAL_STANDARD_TIME | "AUS Central Standard Time" |
UTC +10:00 | E_AUSTRALIAN_STANDARD_TIME | "E. Australia Standard Time" |
UTC +10:00 | AUS_EASTERN_STANDARD_TIME | "AUS Eastern Standard Time" |
UTC +10:00 | WEST_PACIFIC_STANDARD_TIME | "West Pacific Standard Time" |
UTC +10:00 | TASMANIA_STANDARD_TIME | "Tasmania Standard Time" |
UTC +10:00 | VLADIVOSTOK_STANDARD_TIME | "Vladivostok Standard Time" |
UTC +10:30 | LORD_HOWE_STANDARD_TIME | "Lord Howe Standard Time" |
UTC +11:00 | BOUGAINVILLE_STANDARD_TIME | "Bougainville Standard Time" |
UTC +11:00 | RUSSIA_TIME_ZONE_10 | "Russia Time Zone 10" |
UTC +11:00 | MAGADAN_STANDARD_TIME | "Magadan Standard Time" |
UTC +11:00 | NORFOLK_STANDARD_TIME | "Norfolk Standard Time" |
UTC +11:00 | SAKHALIN_STANDARD_TIME | "Sakhalin Standard Time" |
UTC +11:00 | CENTRAL_PACIFIC_STANDARD_TIME | "Central Pacific Standard Time" |
UTC +12:00 | RUSSIA_TIME_ZONE_11 | "Russia Time Zone 11" |
UTC +12:00 | NEW_ZEALAND_STANDARD_TIME | "New Zealand Standard Time" |
UTC +12:00 | UTC_12 | "UTC+12" |
UTC +12:00 | FIJI_STANDARD_TIME | "Fiji Standard Time" |
UTC +12:00 | KAMCHATKA_STANDARD_TIME | "Kamchatka Standard Time" |
UTC +12:45 | CHATHAM_ISLANDS_STANDARD_TIME | "Chatham Islands Standard Time" |
UTC +13:00 | TONGA__STANDARD_TIME | "Tonga Standard Time" |
UTC +13:00 | SAMOA_STANDARD_TIME | "Samoa Standard Time" |
UTC +14:00 | LINE_ISLANDS_STANDARD_TIME | "Line Islands Standard Time" |