Importer une table de comptage
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Importe une table de nombres créée précédemment
catégorie : Learning avec des nombres
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Vue d’ensemble du module
cet article explique comment utiliser le module importer le nombre de tables dans Machine Learning Studio (classic).
l’objectif du module Import Count Table est de permettre aux clients qui ont créé une table de statistiques basées sur le nombre à l’aide d’une version antérieure de Machine Learning de mettre à niveau leur expérience. Ce module fusionne les tables de nombres existantes avec les nouvelles données.
pour obtenir des informations générales sur les tables de nombres et la façon dont elles sont utilisées pour créer des fonctionnalités, consultez Learning avec des nombres.
Important
Ce module est fourni uniquement à des fins de compatibilité descendante avec les expériences qui utilisent la table de nombre de builds dépréciée et les modules Caractériseur comptage Count dépréciés. Nous vous recommandons de mettre à niveau votre expérience pour utiliser les modules les plus récents, afin de tirer parti des nouvelles fonctionnalités.
Pour toutes les nouvelles expériences, nous vous recommandons d’utiliser les modules suivants :
- Créer une transformation de comptage
- Modifier les paramètres de table de comptage
- Fusionner une transformation de comptage
Procédure de configuration de la table des nombres d’importations
dans Machine Learning Studio (classique), ouvrez une expérience qui contient une table de nombres créée à l’aide du module déprécier le nombre de builds.
Ajoutez le module importer le nombre de tables à l’expérience.
Connecter les deux sorties du module de la table de nombre de builds (déconseillées) aux ports d’entrée correspondants de la table des nombres d’importations.
Si vous avez un autre jeu de données de nombres que vous souhaitez fusionner avec la table des nombres importés, connectez-le à l’entrée la plus à droite pour le module Importer la table de nombres .
Utilisez l’option type de comptage pour spécifier l’emplacement et le mode de stockage de la table de nombres :
jeude données : les données utilisées pour générer des nombres sont enregistrées en tant que dataset dans Machine Learning Studio (classic).
objet blob: les données utilisées pour générer des nombres sont stockées sous la forme d’un objet blob de blocs dans Windows stockage Azure.
MapReduce: les données utilisées pour générer des nombres sont stockées sous la forme d’un objet blob dans Windows stockage Azure.
Cette option est généralement recommandée pour les jeux de données très volumineux. Pour accéder aux nombres, vous devez activer le cluster HDInsight. un travail de MapReduce est lancé pour effectuer le comptage. Ces deux activités peuvent entraîner des coûts de stockage et de calcul.
Pour plus d’informations, consultez HDInsight sur Azure.
Après avoir spécifié le mode de stockage des données, vous devrez peut-être fournir des informations de connexion supplémentaires pour les données, même si vous avez déjà utilisé un module importer des données dans l’expérience pour accéder aux données. Cela est dû au fait que le module Count Caractériseur comptage (Deprecated) accède séparément au stockage des données afin de pouvoir lire les données et générer les tables requises.
Utilisez l’option de type de table Count pour spécifier le format et le mode de stockage de la table utilisée pour stocker les nombres.
Dictionary: utilise une table de nombres de dictionnaires.
Toutes les valeurs de colonne dans les colonnes sélectionnées sont traitées comme des chaînes et sont hachées à l'aide d'un tableau de bits pouvant atteindre une taille de 31 bits. Par conséquent, toutes les valeurs de colonne sont représentées par un entier 32 bits non négatif.
CMSketch: utilise une table enregistrée dans la table d’esquisse minimale Count.
Avec ce format, plusieurs fonctions de hachage indépendantes avec une plus petite plage sont utilisées pour améliorer l’efficacité de la mémoire et réduire le risque de collisions de hachage.
En général, vous devez utiliser l’option dictionnaire pour les jeux de données plus petits ( < 1 Go) et utiliser l’option CMSketch pour les jeux de données plus volumineux.
Exécutez l’expérience.
Lorsque vous avez terminé, cliquez avec le bouton droit sur la sortie du module importer le nombre de tables , sélectionnez enregistrer en tant que transformation, puis tapez un nom pour la transformation. Dans ce cas, les tables de nombres fusionnées et les paramètres de caractérisation que vous avez éventuellement appliqués sont enregistrés dans un format qui peut être appliqué à un nouveau jeu de données.
Exemples
Explorez des exemples de caractérisation basés sur le nombre à l’aide de ces exemples d’expériences dans le Azure ai Gallery:
Prédiction de retard de vol: montre comment les caractérisation basés sur le nombre peuvent être utiles dans un jeu de données très volumineux.
Learning avec des nombres : classification multiclasse avec des données de taxi à newyork : illustre l’utilisation des fonctionnalités basées sur les nombres dans une tâche de prédiction multiclasse.
Learning avec des nombres : classification binaire avec des données de taxi à newyork : utilise les fonctionnalités basées sur le nombre dans une tâche de classification binaire.
Notes
ces expériences de la galerie ont été créées à l’aide de la version antérieure, désormais déconseillée, du Learning avec les modules count. Lorsque vous ouvrez l’expérience dans Studio (Classic), l’expérience est automatiquement mise à niveau pour utiliser les modules les plus récents.
Entrées attendues
Nom | Type | Description |
---|---|---|
Métadonnées des nombres | Table de données | Métadonnées des nombres |
Table de nombres | Table de données | Table de nombres |
Jeu de données compté | Table de données | Jeu de données utilisé pour le comptage |
Paramètres du module
Nom | Type | Plage | Facultatif | Default | Description |
---|---|---|---|---|---|
Type de comptage | CountingType | Obligatoire | Type de comptage |
Sorties
Nom | Type | Description |
---|---|---|
Comptage de la transformation | Interface ITransform | La transformation de comptage |
Exceptions
Exception | Description |
---|---|
Erreur 0003 | Cette exception se produit si une ou plusieurs entrées sont null ou vide. |
Erreur 0018 | Une exception se produit si le jeu de données d’entrée n’est pas valide. |
pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.
pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.