Partager via


Exporter vers Table Azure

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

cet article explique comment utiliser l’option exporter vers Azure dans le module exporter des données dans Machine Learning Studio (classic).

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Cette option est utile lorsque vous souhaitez exporter des résultats ou des données intermédiaires à partir d’une expérience Machine Learning dans une table Azure. Le service de table Azure est un service de gestion des données dans Azure qui permet de stocker de grandes quantités de données non relationnelles structurées. Il s’agit d’un magasin de données NoSQL qui accepte les appels authentifiés provenant de l’intérieur et de l’extérieur d’Azure.

Comment exporter des données vers une table Azure

  1. Ajoutez le module Exporter les données à votre expérience. Vous pouvez trouver ce module dans la catégorie entrée et sortie de données dans Studio (Classic).

  2. Connecterz-le au module qui produit les données que vous souhaitez exporter vers le stockage table Azure.

  3. Spécifiez si vous voulez exporter des données vers une ressource partagée publique ou un compte de stockage privé qui nécessite des informations d’identification de connexion, en définissant l’option type d’authentification .

    • Public (URL SAS): choisissez cette option si le compte prend en charge l’accès via une URL SAS. Dans le champ URI de la table SAS , tapez ou collez l’URI complet qui définit le compte et l’objet BLOB public.

      L’URL SAS est une URL d’accès lié à la durée que vous pouvez générer à l’aide d’un utilitaire Azure Storage. Dans une page accessible via une URL SAS, les données peuvent être stockées à l’aide des formats suivants : CSV, TSV et ARFF.

    • Compte: choisissez cette option si vos données se trouvent dans un compte privé . Vous devez également fournir les informations d’identification, notamment le nom du compte et la clé.

  4. Si vous souhaitez exporter vos données vers un stockage privé sécurisé, fournissez les informations d’identification nécessaires pour accéder au compte :

    • Nom du compte de table: tapez ou collez le nom du compte qui contient l’objet BLOB auquel vous souhaitez accéder. Par exemple, si l’URL complète du compte de stockage est https://myshared.table.core.windows.net, vous devez saisir myshared.

    • Clé de compte de table: collez la clé d’accès associée au compte de stockage.

    • Nomde la table : tapez le nom de la table spécifique que vous souhaitez lire.

  5. Spécifiez les colonnes à enregistrer dans le magasin de tables, ainsi que les colonnes à utiliser lors de la définition du schéma de la table, à l’aide des propriétés de la colonne.

    • clé de partition: choisissez la colonne à utiliser pour le partitionnement du dataset enregistré pour la table dans stockage Azure. Dans Azure, les tables sont partitionnées pour prendre en charge l'équilibrage de charge entre les nœuds de stockage. Toutes les entités de table sont organisées par partition ; par conséquent, la propriété PartitionKey est requise pour toutes les opérations de table.

    • Clé de ligne de table Azure: choisissez la colonne qui doit être utilisée pour la propriété RowKey . La propriété RowKey est une propriété système requise pour chaque entité d’une table. Avec la propriété PartitionKey , il forme un index unique pour chaque ligne de la table.

    Notes

    Vous devez utiliser des colonnes différentes pour RowKey et PartitionKey. Assurez-vous que toute colonne que vous sélectionnez pour RowKey ou PartitionKey est également incluse dans la liste des colonnes de destination, ou qu’une erreur est générée.

    • Colonnes d’origine de table Azure: sélectionnez toutes les colonnes supplémentaires du jeu de données que vous souhaitez enregistrer dans la table Azure. Vous devez également inclure les colonnes sélectionnées pour PartitionKey et RowKey.

    pour plus d’informations sur les tables de stockage Azure, consultez présentation du modèle de données du Service de Table.

  6. Spécifiez les noms des colonnes à écrire dans la table.

    Important

    Vous devez fournir un nom de colonne pour chaque colonne que vous envoyez à la table, y compris les colonnes RowKey, PartitionKeyet All Origin.

    Si le nombre de noms de colonne que vous fournissez ne correspond pas au nombre de colonnes de sortie, une erreur est générée.

    Si vous tapez de nouveaux noms de colonnes, ceux-ci doivent être fournis dans l’ordre des index de colonne des colonnes sources.

  7. Mode écriture de table Azure: indiquez comment vous souhaitez que les données d’exportation se comportent lorsque les données existent déjà dans la table Azure.

    • Insert: l' Insert Entity opération insère une nouvelle entité avec une clé primaire unique, qui est formée à partir d’une combinaison des propriétés PartitionKey et RowKey .

    • Fusion: l' Merge Entity opération met à jour une entité existante en mettant à jour les propriétés de l’entité. Cette opération ne remplace pas l'entité existante.

    • Remplacer: l' Update Entity opération remplace le contenu de l’entité donnée dans une table.

    • InsertOrReplace: l' InsertOrReplace Entity opération insère l’entité si l’entité n’existe pas. Si l'entité existe, elle remplace l'entité existante.

    • InsertOrMerge: l' InsertOrMerge Entity opération insère l’entité si l’entité n’existe pas. Si l'entité existe, elle fusionne les propriétés de l'entité fournie avec celles de l'entité existante.

  8. Utiliser les résultats mis en cache: indiquez si vous souhaitez que les données soient actualisées chaque fois que l’expérimentation est exécutée.

    Si vous sélectionnez cette option, le module Exporter les données enregistre les données dans la table spécifiée lors de la première exécution de l’expérience, puis n’effectue pas d’écriture, à moins qu’il y ait des modifications en amont.

    Si vous désélectionnez cette option, les données sont écrites dans la destination chaque fois que l’expérimentation est exécutée, que les données soient identiques ou non.

  9. Exécutez l’expérience.

Notes techniques

Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.

Questions courantes

Pourquoi ai-je obtenu une erreur lors de l’écriture dans une table existante ?

Vérifiez le schéma de la table pour vous assurer que les noms de colonnes et les types de données sont identiques. Par exemple, dans le stockage table Azure, la colonne ID est supposée être une chaîne.

Si vous recevez l’erreur, erreur 0027 : la taille des objets passés est incohérente, vérifiez que la table existe dans le conteneur spécifié. actuellement, les ML Azure peuvent écrire uniquement dans des tables existantes.

Pourquoi est-ce que j’obtiens une erreur indiquant qu’une colonne existante est introuvable

Si vous n’avez pas exécuté l’expérience, les colonnes en amont ne sont parfois pas détectées par les données d’exportation. Si vous apportez des modifications en amont dans l’expérience, vous devrez peut-être supprimer le module Exporter les données , puis l’ajouter et le reconfigurer.

Comment éviter de réécrire les mêmes données inutilement

Si les données de votre expérimentation changent pour une raison quelconque, le module Exporter les données écrira toujours les nouvelles données.

Toutefois, si vous exécutez l’expérience avec d’autres modifications qui n’affectent pas les résultats, affectez la valeur TRUE à l’option utiliser les résultats en cache . Le module vérifie si l’expérience a été exécutée précédemment à l’aide des mêmes options et, si un résultat précédent est trouvé, les données ne sont pas écrites dans la table Azure.

Puis-je exporter des données vers une autre région géographique

Oui. Toutefois, si le compte de stockage se trouve dans une région différente du nœud de calcul utilisé pour l’expérience Machine Learning, l’accès aux données peut être plus lent. En outre, vous êtes facturé pour l’entrée et la sortie des données de l’abonnement.

Exemples

Pour obtenir des exemples d’utilisation de ces modules Machine Learning, consultez la Azure ai Gallery.

Paramètres du module

Options publiques ou SAP-public

Nom Plage Type Default Description
URI de la table SAP n'importe laquelle String

Compte-options de compte privées

Nom Plage Type Default Description
Nom du compte de la table
Clé du compte de la table n'importe laquelle SecureString

Options de stockage

Nom Plage Type Default Description
Nom de la table String aucun
Clé de partition n'importe laquelle SecureString aucun Choisissez la colonne à utiliser comme clé lors du partitionnement de la table. Si aucune colonne n’est sélectionnée, nom de la colonne comme clé de partition pour toutes les entrées
Clé de ligne de table Azure n'importe laquelle ColumnPicker aucun Choisissez la colonne qui contient l’identificateur unique pour les lignes de la table. La valeur par défaut est une clé de ligne basée sur un GUID.
Colonnes d'origine de la table Azure n'importe laquelle ColumnPicker aucun Spécifiez les colonnes à inclure dans la table, par nom ou par index de colonne.
Colonnes de destination de la table Azure n'importe laquelle String aucun Tapez les noms des colonnes à utiliser dans la table de destination
Mode d'écriture de la table Azure List : insérer, fusionner, remplacer, InsertOrReplace, InsertOrMerge Énumération aucun
Utiliser les résultats mis en cache TRUE/FALSE Booléen false Le module s’exécute uniquement si le cache valide n’existe pas ; Sinon, utilisez les données mises en cache à partir de l’exécution précédente.

Exceptions

Exception Description
Erreur 0027 Une exception se produit quand deux objets qui doivent avoir la même taille ne l'ont pas.
Erreur 0003 Une exception se produit si une ou plusieurs entrées ont la valeur Null ou sont vides.
Erreur 0029 Une exception se produit lorsqu'un URI non valide est passé.
Erreur 0030 Une exception se produit lorsqu'il n'est pas possible de télécharger un fichier.
Erreur 0002 Une exception se produit si un ou plusieurs paramètres n'ont pas pu être analysés ou convertis à partir du type spécifié dans le type requis par la méthode cible.
Erreur 0009 Une exception se produit si le nom du compte de stockage Azure ou le nom du conteneur est spécifié de manière incorrecte.
Erreur 0048 Une exception se produit quand il n'est pas possible d'ouvrir un fichier.
Erreur 0046 Une exception se produit quand il n'est pas possible de créer un répertoire sur le chemin d'accès spécifié.
Erreur 0049 Une exception se produit quand il n'est pas possible d'analyser un fichier.

pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.

pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.

Voir aussi

Importer des données
Exporter les données
Exporter vers Azure SQL Database
Exportation vers Stockage Blob Azure
Exporter vers une requête Hive