Registres Machine Learning pour opérations d’apprentissage automatique (MLOps)
Cet article explique comment les registres Azure Machine Learning dissocient les ressources Machine Learning des espaces de travail, ce qui vous permet d’utiliser des MLOps dans les environnements de développement, de test et de production. Vos environnements peuvent varier en fonction de la complexité de vos systèmes informatiques. Les facteurs suivants influencent le nombre et le type d’environnements dont vous avez besoin :
- Stratégies de sécurité et de conformité. Les environnements de production doivent parfois être isolés des environnements de développement en ce qui concerne les contrôles d’accès, l’architecture réseau et l’exposition des données.
- Abonnements. Les environnements de développement et les environnements de production utilisent souvent des abonnements distincts à des fins de facturation, de budgétisation et de gestion des coûts.
- Régions. Vous pouvez être amené à effectuer un déploiement sur différentes régions Azure pour permettre la prise en charge des impératifs de latence et de redondance.
Dans les scénarios précédents, vous pouvez être amené à utiliser différents espaces de travail Azure Machine Learning à des fins de développement, de test et de production. Cette configuration présente les problèmes potentiels suivants pour la formation et le déploiement des modèles :
Vous devrez peut-être former un modèle dans un espace de travail de développement, mais également le déployer sur un point de terminaison dans un espace de travail de production, éventuellement dans un autre abonnement ou une autre région Azure. Dans ce cas, vous devez être en mesure de suivre la tâche de formation. Par exemple, si vous rencontrez des problèmes d’exactitude ou de performance avec le déploiement en production, vous devrez analyser les métriques, les journaux, le code, l’environnement ainsi que les données utilisées pour former le modèle.
Vous devrez peut-être développer un pipeline de formation avec des données de test ou des données anonymes dans l’espace de travail de développement, mais reformer le modèle avec des données de production dans l’espace de travail de production. Dans ce cas, vous devrez peut-être comparer les métriques de formation sur des données d’exemples et des données de production pour vérifier si les optimisations de formation fonctionnent correctement avec les données réelles.
MLOps entre plusieurs espaces de travail avec des registres
Un registre, à l’image d’un dépôt Git, dissocie les ressources Machine Learning des espaces de travail, et héberge les ressources dans un emplacement central, les mettant ainsi à la disposition de tous les espaces de travail de votre organisation. Vous pouvez utiliser des registres pour stocker et partager des ressources comme des modèles, des environnements, des composants et des jeux de données.
Pour promouvoir des modèles dans les environnements de développement, de test et de production, vous pouvez commencer par développer un modèle de manière itérative dans l’environnement de développement. Lorsque vous disposez d’un bon modèle candidat, vous pouvez le publier dans un registre. Vous pouvez ensuite déployer le modèle à partir du registre sur des points de terminaison dans différents espaces de travail.
Conseil
Si vous disposez déjà de modèles inscrits dans un espace de travail, vous pouvez les promouvoir dans un registre. Vous pouvez également inscrire un modèle directement dans un registre à partir de la sortie d’une tâche de formation.
Pour développer un pipeline dans un espace de travail, puis l’exécuter dans d’autres espaces de travail, commencez par inscrire les composants et les environnements qui constituent les blocs de construction du pipeline. Quand vous soumettez le travail de pipeline, les données de calcul et les données de formation, qui sont spécifiques à chaque espace de travail, déterminent l’espace de travail à exécuter.
Le diagramme suivant montre la promotion du pipeline de formation entre les espaces de travail d’exploration et de développement, puis la promotion du modèle formé de l’environnement de test à l’environnement de production.