Identifier les ressources Azure Machine Learning
Les ressources dans Azure Machine Learning font référence à l’infrastructure dont vous avez besoin pour exécuter un workflow de Machine Learning. Dans l’idéal, c’est un administrateur qui crée et gère les ressources.
Voici les ressources dans Azure Machine Learning :
- L’espace de travail
- Ressources de calcul
- Magasins de données
Créer et gérer l’espace de travail
L’espace de travail est la ressource de niveau supérieur du service Azure Machine Learning. Les experts en science des données ont besoin d’accéder à l’espace de travail pour effectuer l’apprentissage et le suivi des modèles, mais aussi pour les déployer sur les points de terminaison.
Toutefois, vous devez être vigilant quant aux personnes qui disposent d’un accès total à l’espace de travail. En plus des références aux ressources de calcul et aux magasins de données, vous trouverez l’ensemble des journaux, métriques, sorties, modèles et instantanés de votre code dans l’espace de travail.
Créer et gérer des ressources de calcul
L’une des ressources les plus importantes dont vous avez besoin lors de l’apprentissage ou du déploiement d’un modèle est le calcul. Il existe cinq types de calcul dans l’espace de travail Azure Machine Learning :
- Instances de calcul : Semblable à une machine virtuelle dans le cloud, gérée par l’espace de travail. Cette solution est idéale comme environnement de développement pour exécuter des notebooks (Jupyter).
- Clusters de calcul : Clusters à la demande de nœuds de calcul du processeur ou du processeur graphique dans le cloud, gérés par l’espace de travail. Cette solution est idéale pour les charges de travail de production, car celles-ci sont mises à l’échelle automatiquement selon vos besoins.
- Clusters Kubernetes : Vous permet de créer ou d’attacher un cluster AKS (Azure Kubernetes Service). Cette solution est idéale pour déployer des modèles Machine Learning entraînés dans des scénarios de production.
- Calculs attachés: Permet d’attacher d’autres ressources de calcul Azure à l’espace de travail, comme les pools Spark Azure Databricks ou Synapse.
- Calcul serverless : Un calcul à la demande, entièrement managé, que vous pouvez utiliser pour des travaux d’entraînement.
Remarque
Azure Machine Learning créant et gérant le calcul serverless pour vous, il n’est pas répertorié sur la page de calcul dans le studio. En savoir plus sur l’utilisation du calcul serverless pour l’entraînement du modèle
Bien que le calcul soit la ressource la plus importante quand vous utilisez des charges de travail Machine Learning, il peut s’avérer être la plus coûteuse également. Une meilleure pratique consiste donc à autoriser uniquement les administrateurs à créer et à gérer des ressources de calcul. Les scientifiques des données ne doivent pas être autorisés à modifier le calcul, mais uniquement à utiliser le calcul disponible pour exécuter leurs charges de travail.
Créer et gérer des magasins de données
L’espace de travail ne stocke pas de données. Au lieu de cela, toutes les données sont stockées dans des magasins de données, qui font référence aux services de données Azure. Les informations de connexion à un service de données que représente un magasin de données sont stockées dans le coffre Azure Key Vault.
Quand un espace de travail est créé, un compte Stockage Azure est créé et connecté automatiquement à l’espace de travail. Par conséquent, quatre magasins de données sont déjà ajoutés à votre espace de travail :
workspaceartifactstore
: Se connecte au conteneurazureml
du compte de stockage Azure créé avec l’espace de travail. Utilisé pour stocker des journaux de calcul et d’expérience lors de l’exécution de travaux.workspaceworkingdirectory
: Se connecte au partage de fichiers du compte Stockage Azure créé avec l’espace de travail utilisé par la section Notebooks du studio. Chaque fois que vous chargez des fichiers ou des dossiers pour y accéder à partir d’une instance de calcul, leur chargement est effectué sur ce partage de fichiers.workspaceblobstore
: se connecte au Stockage Blob du compte Stockage Azure créé avec l’espace de travail. Plus précisément le conteneurazureml-blobstore-...
. Défini comme magasin de données par défaut, ce qui signifie qu’à chaque création d’une ressource de données et à chaque chargement de données, vous les stockez dans ce conteneur.workspacefilestore
: se connecte au partage de fichiers du compte Stockage Azure créé avec l’espace de travail. Plus précisément le partage de fichiersazureml-filestore-...
.
En outre, vous pouvez créer des magasins de données pour vous connecter à d’autres services de données Azure. Le plus souvent, vos magasins de données se connectent à un compte Stockage Azure ou à Azure Data Lake Storage (Gen2), car ces services de données sont les plus fréquemment utilisés dans des projets de science des données.