Exportation vers Stockage Blob Azure
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
cet article explique comment utiliser l’option exporter vers Stockage Blob Azure , dans le module exporter des données dans Machine Learning Studio (classic).
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
cette option est utile lorsque vous souhaitez exporter des données à partir d’une expérience Machine Learning vers Stockage Blob Azure. Par exemple, vous pouvez souhaiter partager des sorties de données Machine Learning avec d’autres applications, ou stocker des données intermédiaires ou nettoyer des jeux de données pour les utiliser dans d’autres expériences.
Vous pouvez accéder aux objets Blob Azure à partir de n’importe où, à l’aide du HTTP ou du HTTPS. étant donné que Stockage Blob Azure est un magasin de données non structuré, vous pouvez exporter des données dans différents formats. Les formats CSV, TSV et ARFF sont actuellement pris en charge.
pour exporter des données vers un objet blob Azure pour une utilisation par d’autres applications, vous utilisez le module exporter les données pour enregistrer les données dans Stockage Blob Azure. utilisez ensuite n’importe quel outil capable de lire des données à partir du stockage Azure (par exemple, Excel, des utilitaires de stockage cloud ou d’autres services cloud) pour charger et utiliser les données.
Notes
Les modules Importer des données et Exporter des données peuvent lire et écrire des données uniquement à partir du stockage Azure créé à l’aide du modèle de déploiement classique. en d’autres termes, le nouveau type de compte Stockage Blob Azure qui offre un niveau d’accès de stockage chaud et froid n’est pas encore pris en charge.
En règle générale, les comptes de stockage Azure que vous avez peut-être créés avant que cette option de service ne soit disponible ne devraient pas être affectés.
toutefois, si vous devez créer un nouveau compte pour une utilisation avec Machine Learning, nous vous recommandons de sélectionner Classic pour le modèle de déploiement, ou d’utiliser resource manager et pour le type de compte, de sélectionner usage général plutôt que stockage d' objets Blob.
comment exporter des données vers Stockage Blob Azure
Le service blob Azure sert à stocker de grandes quantités de données, y compris des données binaires. Il existe deux types de stockage d’objets Blob : les objets blob publics et les objets Blob qui nécessitent des informations d’identification de connexion.
Ajoutez le module Exporter les données à votre expérience. Vous pouvez trouver ce module dans la catégorie entrée et sortie de données dans Studio (Classic).
Connecter exporter des données vers le module qui produit les données que vous souhaitez exporter vers Stockage Blob Azure.
Ouvrez le volet Propriétés de exporter des données. pour la destination des données, sélectionnez Stockage Blob Azure.
Pour type d’authentification, choisissez public (URL SAS) si vous savez que le stockage prend en charge l’accès via une URL SAS.
Une URL SAS est un type spécial d’URL qui peut être généré à l’aide d’un utilitaire de stockage Azure et qui est disponible uniquement pendant une période limitée. Elle contient toutes les informations nécessaires pour l’authentification et le téléchargement.
Pour l’URI, saisissez ou collez l’URI complet qui définit le compte et l’objet blob public.
Pour les comptes privés, choisissez Compte, puis indiquez le nom du compte et la clé du compte, afin que l’expérience puisse écrire dans le compte de stockage.
Nom du compte: tapez ou collez le nom du compte dans lequel vous souhaitez enregistrer les données. Par exemple, si l’URL complète du compte de stockage est
https://myshared.blob.core.windows.net
, vous devez saisirmyshared
.Clé de compte: collez la clé d’accès de stockage associée au compte.
Chemin d’accès au conteneur, répertoire ou objet BLOB: tapez le nom de l’objet BLOB dans lequel les données exportées seront stockées. Par exemple, pour enregistrer les résultats de votre expérience dans un nouvel objet blob nommé results01.csv du conteneur prédictions dans un compte nommé mymldata, l’URL complète de l’objet blob serait
https://mymldata.blob.core.windows.net/predictions/results01.csv
.Par conséquent, dans le champ chemin d’accès au conteneur, répertoire ou objet BLOB, vous devez spécifier le nom du conteneur et du BLOB comme suit :
predictions/results01.csv
Si vous spécifiez le nom d’un objet blob qui n’existe pas encore, Azure crée l’objet blob pour vous.
lors de l’écriture dans un objet blob existant, vous pouvez spécifier que le contenu actuel de l’objet blob doit être remplacé en définissant la propriété, Stockage Blob Azure mode écriture. Par défaut, cette propriété est définie sur Erreur, ce qui signifie qu’une erreur est générée chaque fois qu’un fichier blob portant le même nom est trouvé.
Pour le format du fichier blob, sélectionnez le format dans lequel les données doivent être stockées.
CSV: les valeurs séparées par des virgules (CSV) sont le format de stockage par défaut. Pour exporter les en-têtes de colonnes avec les données, sélectionnez l’option Write blob header row (Écrire la ligne d’en-tête d’objet blob). pour plus d’informations sur le format délimité par des virgules utilisé dans Machine Learning, consultez convertir en CSV.
TSV: le format TSV (valeurs séparées par des tabulations) est compatible avec de nombreux outils de machine learning. Pour exporter les en-têtes de colonnes avec les données, sélectionnez l’option Write blob header row (Écrire la ligne d’en-tête d’objet blob). pour plus d’informations sur le format séparé par des tabulations utilisé dans Machine Learning, voir Convert to TSV.
ARFF: ce format prend en charge l’enregistrement des fichiers au format utilisé par l’ensemble d’outils weka. Ce format n’est pas pris en charge pour les fichiers stockés dans une URL SAS. Pour plus d’informations sur le format ARFF, consultez Convert to ARFF.
Utiliser les résultats mis en cache: sélectionnez cette option si vous voulez éviter de réécrire les résultats dans le fichier d’objet BLOB chaque fois que vous exécutez l’expérience. Si aucune autre modification n’est apportée aux paramètres du module, l’expérience écrit les résultats uniquement lors de la première exécution du module, ou lorsque des données sont modifiées.
Exemples
Pour obtenir des exemples d’utilisation du module exporter des données , consultez la Azure ai Gallery:
Convertir le DataSet au format VW: cette expérience utilise le script Python avec le module Exporter les données pour créer des données qui peuvent être utilisées par vowpal Wabbit.
configuration des pipelines d’analyse prédictive à l’aide de Azure SQL Data Warehouse: ce scénario décrit le déplacement des données entre plusieurs composants, y compris Machine Learning et SQL Data Warehouse.
score de lot sans code: ce didacticiel montre comment utiliser Azure Logic Apps pour automatiser l’importation des données utilisées par les expériences et écrire des résultats d’expérience dans le stockage d’objets blob.
faire fonctionner la solution azure ML avec SQL Server sur site à l’aide d’azure data factory: cet article décrit un pipeline de données plus complexe qui renvoie des données à une base de données SQL Server locale, en utilisant le stockage d’objets blob comme étape intermédiaire. L’utilisation d’une base de données locale requiert la configuration d’une passerelle de données, mais vous pouvez ignorer cette partie de l’exemple et utiliser simplement le stockage d’objets BLOB.
Notes techniques
Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.
Questions courantes
Comment éviter d’écrire les données si l’expérience n’a pas changé
Lorsque vos résultats d’expérimentation changent, Export Data enregistre toujours le nouveau jeu de données. Toutefois, si vous exécutez l’expérience à plusieurs reprises sans apporter de modifications qui affectent les données de sortie, vous pouvez sélectionner l’option utiliser les résultats en cache .
Le module vérifie si l’expérience a été exécutée précédemment en utilisant les mêmes données et les mêmes options, et si une exécution précédente est trouvée, l’opération d’écriture n’est pas répétée.
Puis-je enregistrer des données dans un compte dans une autre région géographique
Oui, vous pouvez écrire des données dans des comptes de différentes régions. Toutefois, si le compte de stockage se trouve dans une région différente du nœud de calcul utilisé pour l’expérience Machine Learning, l’accès aux données peut être plus lent. En outre, vous êtes facturé pour l’entrée et la sortie des données de l’abonnement.
Paramètres du module
Options générales
Nom | Plage | Type | Default | Description |
---|---|---|---|---|
Source de données | Liste | Source ou récepteur de données | Stockage Blob Azure | la destination peut être un fichier dans le stockage d’objets BLOB azure, une table azure, une table ou une vue dans un Azure SQL Database ou une table Hive. |
Utiliser les résultats mis en cache | TRUE/FALSE | Booléen | false | Le module s’exécute uniquement si le cache valide n’existe pas ; Sinon, utilisez les données mises en cache à partir de l’exécution précédente. |
Spécifiez le type d'authentification | SAS/compte | AuthenticationType | Compte | Indique si les informations d’identification du compte ou de la SAP doivent être utilisées pour l’autorisation d’accès |
Options de stockage public ou SAS-public
Nom | Plage | Type | Default | Description |
---|---|---|---|---|
URI SAS pour objet blob | n'importe laquelle | String | aucun | URI SAS de l’objet BLOB dans lequel écrire (obligatoire) |
Format de fichier SAS | ARFF CSV TSV |
LoaderUtils. FileTypes | CSV | Indique si le fichier est CSV, TSV ou ARFF. (obligatoire) |
Écrire la ligne d'en-tête SAS | TRUE/FALSE | Booléen | false | Indique si les en-têtes de colonne doivent être écrits dans le fichier |
Options de stockage privée du compte
Nom | Plage | Type | Default | Description |
---|---|---|---|---|
Nom du compte Azure | n'importe laquelle | String | aucun | Nom du compte d’utilisateur Azure |
Clé de compte Azure | n'importe laquelle | SecureString | aucun | Clé de stockage Azure |
Chemin d'accès à l'objet blob commençant par le conteneur | n'importe laquelle | String | aucun | Nom du fichier d’objet BLOB, en commençant par le nom du conteneur |
mode d’écriture Stockage Blob Azure | Liste : erreur, remplacement | enum : BlobFileWriteMode | Erreur | Choisir la méthode d’écriture des fichiers d’objets BLOB |
Format de fichier d'objet blob | ARFF CSV TSV |
LoaderUtils. FileTypes | CSV | Indique si le fichier BLOB est CSV, TSV ou ARFF |
Écrire la ligne d'en-tête d'objet blob | TRUE/FALSE | Booléen | false | Indique si le fichier BLOB doit avoir une ligne d’en-tête |
Exceptions
Exception | Description |
---|---|
Erreur 0027 | Une exception se produit quand deux objets qui doivent avoir la même taille ne l'ont pas. |
Erreur 0003 | Une exception se produit si une ou plusieurs entrées ont la valeur Null ou sont vides. |
Erreur 0029 | Une exception se produit lorsqu'un URI non valide est passé. |
Erreur 0030 | Une exception se produit lorsqu'il n'est pas possible de télécharger un fichier. |
Erreur 0002 | Une exception se produit si un ou plusieurs paramètres n'ont pas pu être analysés ou convertis à partir du type spécifié dans le type requis par la méthode cible. |
Erreur 0009 | Une exception se produit si le nom du compte de stockage Azure ou le nom du conteneur est spécifié de manière incorrecte. |
Erreur 0048 | Une exception se produit quand il n'est pas possible d'ouvrir un fichier. |
Erreur 0046 | Une exception se produit quand il n'est pas possible de créer un répertoire sur le chemin d'accès spécifié. |
Erreur 0049 | Une exception se produit quand il n'est pas possible d'analyser un fichier. |
pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.
pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.
Voir aussi
Importer des données
Exporter les données
Exporter vers Azure SQL Database
Exporter vers une requête Hive
Exporter vers Table Azure