Partager via


Azure Machine Learning en tant que produit de données pour l’analytique à l’échelle du cloud

Azure Machine Learning est une plateforme intégrée permettant de gérer le cycle de vie du Machine Learning de début à la fin, notamment de l’aide sur la création, l’opération et la consommation de modèles et de flux de travail Machine Learning. Voici quelques avantages du service :

  • Les fonctionnalités prennent en charge les créateurs pour augmenter leur productivité en les aidant à gérer les expériences, à accéder aux données, à suivre les travaux, à paramétrer les hyperparamètres et à automatiser les flux de travail.

  • La capacité du modèle à expliquer, reproduire, auditer et intégrer à DevOps, ainsi qu’un modèle de contrôle de sécurité riche, peut prendre en charge les opérateurs pour répondre aux exigences de gouvernance et de conformité.

  • Les fonctionnalités d’inférence managée et l’intégration robuste avec les services de calcul et de données Azure peuvent vous aider à simplifier la façon dont le service est consommé.

Azure Machine Learning couvre tous les aspects du cycle de vie de la science des données. Il couvre l’inscription des banques de données et des jeux de données pour le déploiement de modèles. Il peut être utilisé pour n’importe quel type de Machine Learning, du Machine Learning classique au Deep Learning. Il comprend l’apprentissage supervisé et non supervisé. Que vous préfériez écrire Python, du code R ou utiliser des options de code zéro ou de faible code, telles que le concepteur, vous pouvez générer, entraîner et suivre des modèles Machine Learning précis et deep learning dans un espace de travail Azure Machine Learning.

Azure Machine Learning, la plateforme Azure et les services Azure AI peuvent collaborer pour gérer le cycle de vie du Machine Learning. Un professionnel du Machine Learning peut utiliser Azure Synapse Analytics, Azure SQL Database ou Microsoft Power BI pour commencer à analyser des données et à passer à Azure Machine Learning pour le prototypage, la gestion de l’expérimentation et l’opérationnalisation. Dans les zones d’atterrissage Azure, Azure Machine Learning peut être considéré comme un produit de données .

Azure Machine Learning dans l’analytique à l’échelle du cloud

Une base de zone d’atterrissage du Framework d’adoption du cloud (CAF), des zones d’atterrissage de données d’analytique à l’échelle du cloud et la configuration d’Azure Machine Learning configurent des professionnels du Machine Learning avec un environnement préconfiguré vers lequel ils peuvent déployer à plusieurs reprises de nouvelles charges de travail Machine Learning ou migrer des charges de travail existantes. Ces fonctionnalités peuvent aider les professionnels du Machine Learning à gagner en agilité et en valeur pour leur temps.

Les principes de conception suivants peuvent guider l’implémentation des zones d’atterrissage Azure Machine Learning :

  • Accès rapide aux données : préconfigurez les composants de stockage de zone d’atterrissage en tant que magasins de données dans l’espace de travail Azure Machine Learning.

  • Collaboration activée : organiser les espaces de travail par projet et centraliser la gestion des accès pour les ressources de zone d’atterrissage afin de prendre en charge l’ingénierie des données, la science des données et les professionnels du Machine Learning pour travailler ensemble.

  • Implémentation sécurisée : comme valeur par défaut pour chaque déploiement, suivez les bonnes pratiques et utilisez l’isolation réseau, l’identité et la gestion des accès pour sécuriser les ressources de données.

  • Libre-service : les professionnels de machine learning peuvent gagner en agilité et en organisation en explorant les options de déploiement de nouvelles ressources de projet.

  • Séparation des préoccupations entre la gestion des données et la consommation de données : La transmission d'identité est le type d’authentification par défaut pour Azure Machine Learning et le stockage.

  • Application de données plus rapide (alignée sur la source) : les zones d’atterrissage Azure Data Factory, Azure Synapse Analytics et Databricks peuvent être préconfigurées pour établir un lien vers Azure Machine Learning.

  • Observabilité : Les configurations centralisées de journalisation et de référence peuvent aider à surveiller l’environnement.

Vue d’ensemble de l’implémentation

Remarque

Cette section recommande des configurations spécifiques à l’analytique à l’échelle du cloud. Il complète la documentation Azure Machine Learning et les meilleures pratiques du Cloud Adoption Framework.

Organisation et configuration de l’espace de travail

Vous pouvez déployer le nombre d’espaces de travail Machine Learning dont vos charges de travail nécessitent et pour chaque zone d’atterrissage que vous déployez. Les recommandations suivantes peuvent vous aider à configurer :

  • Déployez au moins un espace de travail Machine Learning par projet.

  • Selon le cycle de vie de votre projet Machine Learning, déployez un espace de travail de développement (dev) pour prototyper des cas d’utilisation et explorer les données dès le début. Pour le travail nécessitant une expérimentation, un test et un déploiement continus, déployez un espace de travail intermédiaire et de production.

  • Lorsque plusieurs environnements sont nécessaires pour les espaces de travail de développement, de préproduction et de production dans une zone d’atterrissage de données, nous vous recommandons d’éviter la duplication des données en plaçant chaque environnement dans la même zone d’atterrissage des données de production.

  • Consultez Organiser et configurer des environnements Azure Machine Learning pour en savoir plus sur l’organisation et la configuration des ressources Azure Machine Learning.

Pour chaque configuration de ressource par défaut dans une zone d’atterrissage de données, un service Azure Machine Learning est déployé dans un groupe de ressources dédié avec les configurations et ressources dépendantes suivantes :

  • Azure Key Vault
  • Application Insights
  • Registre de Conteneurs Azure
  • Utilisez Azure Machine Learning pour vous connecter à un compte de stockage Azure et à l’authentification basée sur les identités Microsoft Entra pour aider les utilisateurs à se connecter au compte.
  • La journalisation des diagnostics est configurée pour chaque espace de travail et reliée à une ressource centrale Log Analytics à l’échelle de l’entreprise ; cela peut faciliter l'analyse centralisée de l’état de santé des travaux Azure Machine Learning et des statuts des ressources au sein et à travers les zones de destination.
  • Consultez Qu’est-ce qu’un espace de travail Azure Machine Learning ? pour en savoir plus sur les ressources et dépendances Azure Machine Learning.

Intégration avec les services de base de la zone d’accueil des données

La zone d’atterrissage de données est fournie avec un ensemble de services par défaut qui sont déployés dans la couche de services de plateforme. Ces services de base peuvent être configurés quand Azure Machine Learning est déployé dans la zone d’atterrissage des données.

  • Connectez des espaces de travail Azure Synapse Analytics ou Databricks en tant que services liés pour intégrer des données et traiter le Big Data.

  • Par défaut, les services data lake sont provisionnés dans la zone d’atterrissage des données et les déploiements de produits Azure Machine Learning sont fournis avec des connexions (magasins de données) préconfigurées sur ces comptes de stockage.

Vue d’ensemble de l’analytique des produits de données pour Azure Machine Learning.

Connectivité réseau

La mise en réseau pour l'implémentation d'Azure Machine Learning dans les zones d'atterrissage Azure est configurée selon les meilleures pratiques de sécurité pour Azure Machine Learning et les meilleures pratiques de mise en réseau du CAF . Ces meilleures pratiques incluent les configurations suivantes :

  • Azure Machine Learning et les ressources dépendantes sont configurées pour utiliser des points de terminaison Private Link.
  • Les ressources de calcul managées sont déployées uniquement avec des adresses IP privées.
  • La connectivité réseau au référentiel d’images de base publique Azure Machine Learning et aux services partenaires comme Azure Artifacts peut être configurée au niveau du réseau.

Gestion des identités et des accès

Tenez compte des recommandations suivantes pour la gestion des identités utilisateur et l’accès avec Azure Machine Learning :

  • Les magasins de données dans Azure Machine Learning peuvent être configurés pour utiliser l’authentification basée sur les informations d’identification ou l’identité. Lorsque vous utilisez des configurations de contrôle d'accès et de lac de données dans Azure Data Lake Storage Gen2, configurez les magasins de données pour utiliser l'authentification basée sur l'identité. Cela permet à Azure Machine Learning d'optimiser les autorisations d'accès utilisateur pour le stockage.

  • Utilisez des groupes Microsoft Entra pour gérer les autorisations utilisateur pour les ressources de stockage et de Machine Learning.

  • Azure Machine Learning peut utiliser des identités managées affectées par l'utilisateur pour le contrôle d'accès et limiter l'étendue d'accès au Azure Container Registry, au Key Vault, au Stockage Azure et à Application Insights.

  • Créez des identités managées affectées par l’utilisateur aux clusters de calcul managés créés dans Azure Machine Learning.

Provisionner l’infrastructure via le libre-service

Le libre-service peut être activé et régi par des stratégies pour Azure Machine Learning. Le tableau suivant répertorie un ensemble de stratégies par défaut lorsque vous déployez Azure Machine Learning. Pour plus d’informations, consultez Définitions de stratégies intégrées Azure Policy pour Azure Machine Learning.

Politique Type Référence
Les espaces de travail Azure Machine Learning doivent utiliser Azure Private Link. Intégré Voir dans le portail Azure
Les espaces de travail Azure Machine Learning doivent utiliser des identités managées affectées par l’utilisateur. Intégré Voir dans le portail Azure
[Préversion] : Configurer les registres autorisés pour les capacités de calcul Azure Machine Learning spécifiées. Intégré Afficher dans le portail Azure
Configurez des espaces de travail Azure Machine Learning avec des points de terminaison privés. Intégré Voir dans le portail Azure
Configurez les calculs Machine Learning pour désactiver les méthodes d’authentification locales. Intégré Vue dans le portail Azure
Append-machinelearningcompute-setupscriptscreationscript Personnalisé (zones d’atterrissage CAF) Vue sur GitHub
Deny-machinelearning-hbiworkspace Personnalisé (zones d’atterrissage CAF) Vue sur GitHub
Deny-machinelearning-publicaccesswhenbehindvnet Personnalisé (zones d’atterrissage CAF) Afficher sur GitHub
Deny-machinelearning-AKS Personnalisé (zones d’atterrissage CAF) Vue sur GitHub
Deny-machinelearningcompute-subnetid Personnalisé (zones d’atterrissage CAF) Vue sur GitHub
Deny-machinelearningcompute-vmsize Personnalisé (zones d’atterrissage CAF) Afficher sur GitHub
Deny-machinelearningcomputecluster-remoteloginportpublicaccess Personnalisé (zones d’atterrissage CAF) Afficher sur GitHub
Deny-machinelearningcomputecluster-scale Personnalisé (zones d’atterrissage CAF) Vue sur GitHub

Recommandations pour la gestion de votre environnement

Les zones d’atterrissage des données d’analyse à l’échelle du cloud décrivent l’implémentation de référence pour les déploiements reproductibles, ce qui peut vous aider à configurer des environnements gérables et régis. Tenez compte des recommandations suivantes pour utiliser Azure Machine Learning pour gérer votre environnement :

  • Utilisez des groupes Microsoft Entra pour gérer l’accès aux ressources machine learning.

  • Publiez un tableau de bord de supervision central pour surveiller l’intégrité du pipeline, l’utilisation du calcul et la gestion des quotas pour le Machine Learning.

  • Si vous utilisez traditionnellement des stratégies Azure intégrées et que vous devez répondre à des exigences de conformité supplémentaires, créez des stratégies Azure personnalisées pour améliorer la gouvernance et le libre-service.

  • Pour suivre les coûts de recherche et de développement, déployez un espace de travail Machine Learning dans la zone d’atterrissage en tant que ressource partagée pendant les premières étapes de l’exploration de votre cas d’usage.

Important

Utilisez des clusters Azure Machine Learning pour l’apprentissage de modèle de niveau production et Azure Kubernetes Service (AKS) pour les déploiements de niveau production.

Conseil

Utilisez Azure Machine Learning pour les projets de science des données. Il couvre le flux de travail de bout en bout avec des sous-services et des fonctionnalités, et permet au processus d’être entièrement automatisé.

Étapes suivantes

Utilisez le modèle et les conseils Data Product Analytics pour déployer Azure Machine Learning, et consultez la documentation et les tutoriels Azure Machine Learning pour commencer à créer vos solutions.

Passez aux quatre articles suivants du Framework d’adoption du cloud pour en savoir plus sur le déploiement et les meilleures pratiques de gestion Azure Machine Learning pour les entreprises :