Comprendre les URI
Vous pouvez stocker des données sur votre appareil local ou sur le cloud. Quel que soit l’endroit où vous stockez vos données, vous souhaitez pouvoir y accéder pour entraîner des modèles Machine Learning. Pour rechercher et accéder aux données dans Azure Machine Learning, vous pouvez utiliser Uniform Resource Identifiers (URI).
Comprendre les URI
Un URI référence l’emplacement de vos données. Pour qu’Azure Machine Learning se connecte à vos données, vous devez précéder l’URI du protocole approprié. Il existe trois protocoles courants lors de l’utilisation de données dans le contexte d’Azure Machine Learning :
http(s)
: utilisé pour les magasins de données publics ou privés dans un Stockage Blob Azure ou un emplacement http(s) accessible au public.abfs(s)
: utilisé pour les magasins de données dans Azure Data Lake Storage Gen 2.azureml
: utilisé pour les données stockées dans un magasin de données.
Par exemple, vous pouvez créer un Stockage Blob Azure dans Azure. Pour stocker des données, vous créez un conteneur nommé training-data
. Dans le conteneur, vous créez un dossier datastore-path
. Dans le dossier, vous stockez le fichier CSV diabetes.csv
.
Lorsque vous souhaitez accéder aux données à partir de l’espace de travail Azure Machine Learning, vous pouvez utiliser directement le chemin d’accès au dossier ou au fichier. Lorsque vous souhaitez vous connecter directement au dossier ou au fichier, vous pouvez utiliser le protocole http(s)
. Si le conteneur est défini sur privé, vous devrez fournir une forme d’authentification pour accéder aux données, comme une signature d’accès partagé (SAS).
Lorsque vous créez un magasin de données dans Azure Machine Learning, vous stockez les informations de connexion et d’authentification dans l’espace de travail. Ensuite, pour accéder aux données dans le conteneur, vous pouvez utiliser le protocole azureml
.
Conseil
Un magasin de données est une référence à un compte de stockage existant sur Azure. Par conséquent, lorsque vous faites référence à des données stockées dans un magasin de données, vous pouvez faire référence à des données stockées dans Stockage Blob Azure ou Azure Data Lake Storage. Toutefois, lorsque vous faites référence au magasin de données, vous n’avez pas besoin de vous authentifier, car les informations de connexion stockées avec le magasin de données seront utilisées par Azure Machine Learning.
Une bonne pratique consiste à éviter l’intégration de données sensibles dans votre code, telles que les informations d’authentification. Par conséquent, dans la mesure du possible, vous devez utiliser des magasins de données et des ressources de données dans Azure Machine Learning. Toutefois, pendant l’expérimentation dans les notebooks, vous pouvez vous connecter directement à un emplacement de stockage pour éviter une surcharge inutile.