Partager via


Importer une table de comptage

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Importe une table de nombres créée précédemment

catégorie : Learning avec des nombres

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module importer le nombre de tables dans Machine Learning Studio (classic).

l’objectif du module Import Count Table est de permettre aux clients qui ont créé une table de statistiques basées sur le nombre à l’aide d’une version antérieure de Machine Learning de mettre à niveau leur expérience. Ce module fusionne les tables de nombres existantes avec les nouvelles données.

pour obtenir des informations générales sur les tables de nombres et la façon dont elles sont utilisées pour créer des fonctionnalités, consultez Learning avec des nombres.

Important

Ce module est fourni uniquement à des fins de compatibilité descendante avec les expériences qui utilisent la table de nombre de builds dépréciée et les modules Caractériseur comptage Count dépréciés. Nous vous recommandons de mettre à niveau votre expérience pour utiliser les modules les plus récents, afin de tirer parti des nouvelles fonctionnalités.

Pour toutes les nouvelles expériences, nous vous recommandons d’utiliser les modules suivants :

Procédure de configuration de la table des nombres d’importations

  1. dans Machine Learning Studio (classique), ouvrez une expérience qui contient une table de nombres créée à l’aide du module déprécier le nombre de builds.

  2. Ajoutez le module importer le nombre de tables à l’expérience.

  3. Connecter les deux sorties du module de la table de nombre de builds (déconseillées) aux ports d’entrée correspondants de la table des nombres d’importations.

    Si vous avez un autre jeu de données de nombres que vous souhaitez fusionner avec la table des nombres importés, connectez-le à l’entrée la plus à droite pour le module Importer la table de nombres .

  4. Utilisez l’option type de comptage pour spécifier l’emplacement et le mode de stockage de la table de nombres :

    • jeude données : les données utilisées pour générer des nombres sont enregistrées en tant que dataset dans Machine Learning Studio (classic).

    • objet blob: les données utilisées pour générer des nombres sont stockées sous la forme d’un objet blob de blocs dans Windows stockage Azure.

    • MapReduce: les données utilisées pour générer des nombres sont stockées sous la forme d’un objet blob dans Windows stockage Azure.

      Cette option est généralement recommandée pour les jeux de données très volumineux. Pour accéder aux nombres, vous devez activer le cluster HDInsight. un travail de MapReduce est lancé pour effectuer le comptage. Ces deux activités peuvent entraîner des coûts de stockage et de calcul.

      Pour plus d’informations, consultez HDInsight sur Azure.

    Après avoir spécifié le mode de stockage des données, vous devrez peut-être fournir des informations de connexion supplémentaires pour les données, même si vous avez déjà utilisé un module importer des données dans l’expérience pour accéder aux données. Cela est dû au fait que le module Count Caractériseur comptage (Deprecated) accède séparément au stockage des données afin de pouvoir lire les données et générer les tables requises.

  5. Utilisez l’option de type de table Count pour spécifier le format et le mode de stockage de la table utilisée pour stocker les nombres.

    • Dictionary: utilise une table de nombres de dictionnaires.

      Toutes les valeurs de colonne dans les colonnes sélectionnées sont traitées comme des chaînes et sont hachées à l'aide d'un tableau de bits pouvant atteindre une taille de 31 bits. Par conséquent, toutes les valeurs de colonne sont représentées par un entier 32 bits non négatif.

    • CMSketch: utilise une table enregistrée dans la table d’esquisse minimale Count.

      Avec ce format, plusieurs fonctions de hachage indépendantes avec une plus petite plage sont utilisées pour améliorer l’efficacité de la mémoire et réduire le risque de collisions de hachage.

    En général, vous devez utiliser l’option dictionnaire pour les jeux de données plus petits ( < 1 Go) et utiliser l’option CMSketch pour les jeux de données plus volumineux.

  6. Exécutez l’expérience.

  7. Lorsque vous avez terminé, cliquez avec le bouton droit sur la sortie du module importer le nombre de tables , sélectionnez enregistrer en tant que transformation, puis tapez un nom pour la transformation. Dans ce cas, les tables de nombres fusionnées et les paramètres de caractérisation que vous avez éventuellement appliqués sont enregistrés dans un format qui peut être appliqué à un nouveau jeu de données.

Exemples

Explorez des exemples de caractérisation basés sur le nombre à l’aide de ces exemples d’expériences dans le Azure ai Gallery:

Notes

ces expériences de la galerie ont été créées à l’aide de la version antérieure, désormais déconseillée, du Learning avec les modules count. Lorsque vous ouvrez l’expérience dans Studio (Classic), l’expérience est automatiquement mise à niveau pour utiliser les modules les plus récents.

Entrées attendues

Nom Type Description
Métadonnées des nombres Table de données Métadonnées des nombres
Table de nombres Table de données Table de nombres
Jeu de données compté Table de données Jeu de données utilisé pour le comptage

Paramètres du module

Nom Type Plage Facultatif Default Description
Type de comptage CountingType Obligatoire Type de comptage

Sorties

Nom Type Description
Comptage de la transformation Interface ITransform La transformation de comptage

Exceptions

Exception Description
Erreur 0003 Cette exception se produit si une ou plusieurs entrées sont null ou vide.
Erreur 0018 Une exception se produit si le jeu de données d’entrée n’est pas valide.

pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.

pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.

Voir aussi

Learning with Counts