Modifier les paramètres de table de comptage
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Modifie les paramètres utilisés pour créer des fonctionnalités à partir de nombres
catégorie : Learning avec des nombres
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Vue d’ensemble du module
cet article explique comment utiliser le module modifier les paramètres de la table de nombres dans Machine Learning Studio (classic) pour modifier la façon dont les fonctionnalités sont générées à partir d’une Table de nombres.
En général, pour créer des fonctionnalités basées sur le nombre, vous utilisez la transformation de comptage de build pour traiter un jeu de données et créer une table de nombres, et à partir de cette table de nombres générer un nouvel ensemble de fonctionnalités.
Toutefois, si vous avez déjà créé une table de nombres, vous pouvez utiliser le module modifier les paramètres de la table de nombres pour modifier la définition du mode de traitement des données de nombre. Cela vous permet de créer un ensemble différent de statistiques basées sur les nombres en fonction des données existantes, sans avoir à analyser à nouveau le DataSet.
Comment configurer les paramètres de modification du nombre
Localisez la transformation que vous souhaitez modifier, dans le groupe transformations , puis ajoutez-la à votre expérience.
Vous devez avoir déjà exécuté une expérience qui a créé une transformation de comptage.
Pour modifier une transformation enregistrée: Localisez la transformation dans le groupe transformations , puis ajoutez-la à votre expérience.
Pour modifier une transformation de comptage créée dans la même expérience: si la transformation n’a pas été enregistrée, mais est disponible en tant que sortie dans l’expérience actuelle (par exemple, vérifiez la sortie du module de transformation de comptage de build ), vous pouvez l’utiliser directement en connectant les modules.
Ajoutez le module modifier les paramètres de la table de nombres et connectez la transformation en tant qu’entrée.
Dans le volet Propriétés du module modifier les paramètres de la table de nombres, tapez une valeur à utiliser comme seuil de laCorbeille.
Cette valeur spécifie le nombre minimal d’occurrences qui doivent être trouvées pour chaque valeur de fonctionnalité, afin que les nombres soient utilisés. Si la fréquence de la valeur est inférieure au seuil de la corbeille, la paire valeur-étiquette n’est pas comptée comme un élément discret ; au lieu de cela, tous les éléments dont le nombre est inférieur à la valeur de seuil sont placés dans un seul « poubelle ».
Si vous utilisez un petit jeu de données et que vous comptez et que vous effectuez des formations sur les mêmes données, une bonne valeur de départ est de 1.
Pour obtenir d' autres Pseudo-exemples antérieurs, tapez un nombre qui indique le nombre d’exemples supplémentaires à inclure. Vous n’avez pas besoin de fournir ces exemples ; les Pseudo-exemples sont générés en fonction de la distribution précédente.
Pour la mise à l' échelle du bruit laplacien, tapez une valeur à virgule flottante positive qui représente l’échelle utilisée pour introduire un bruit échantillonné à partir d’une distribution laplacien. Lorsque vous définissez une valeur de mise à l’échelle, un niveau de bruit acceptable est incorporé dans le modèle, de sorte que le modèle est moins susceptible d’être affecté par des valeurs invisibles dans les données.
Dans les fonctionnalités de sortie, choisissez la méthode à utiliser lors de la création de fonctionnalités basées sur le nombre à inclure dans la transformation.
CountsOnly: créer des fonctionnalités à l’aide de Counts.
LogOddsOnly: créez des fonctionnalités à l’aide du journal du rapport des chances.
BothCountsAndLogOdds: créez des fonctionnalités en utilisant à la fois des nombres et des chances de journalisation.
Sélectionnez l’option ignorer la colonne de retour si vous souhaitez remplacer l'
IsBackOff
indicateur dans la sortie lors de la création de fonctionnalités. Lorsque vous sélectionnez cette option, les fonctionnalités basées sur le nombre sont créées même si la colonne n’a pas de valeurs de nombre significatives.Exécutez l’expérience. Vous pouvez ensuite enregistrer la sortie des paramètres Modify Count table en tant que nouvelle transformation, si vous le souhaitez.
Exemples
Pour obtenir des exemples d’utilisation de ce module, consultez la Azure ai Gallery:
Learning avec counts : Binary Classification: montre comment utiliser le module Learning with counts pour générer des fonctionnalités à partir de colonnes de valeurs catégoriques pour un modèle de Classification binaire.
Learning avec des nombres : classification multiclasse avec des données de taxi à newyork : l’exemple montre comment utiliser l’apprentissage avec des modules counts pour effectuer une classification multiclasse sur le jeu de données du taxi à new york disponible publiquement. L’exemple utilise un apprentissage de la régression logistique multiclasse pour modéliser ce problème.
Learning avec des nombres : classification binaire avec des données de taxi à newyork : montre comment utiliser l’apprentissage avec des modules counts pour effectuer une classification binaire sur le jeu de données du taxi à new york disponible publiquement. L’exemple utilise un apprenante de régression logistique à deux classes pour modéliser ce problème.
Notes techniques
Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.
D'un point de vue statistique, vous pouvez sans problème effectuer des comptes et l'apprentissage sur le même jeu de données, si vous définissez le paramètre d'échelle de bruit de Laplace.
Entrées attendues
Nom | Type | Description |
---|---|---|
Comptage de la transformation | Interface ITransform | Transformation de comptage à appliquer |
Paramètres du module
Nom | Type | Plage | Facultatif | Default | Description |
---|---|---|---|---|---|
Plafond de la corbeille | Float | >= 0.0 f | Obligatoire | 10.0f | Seuil sous lequel une valeur de colonne sera implémenter par rapport au Garbage bin |
Autres pseudo-exemples antérieurs | Float | >= 0.0 f | Obligatoire | 42,0 f | Les Pseudo-exemples supplémentaires qui suivent les distributions antérieures doivent être inclus |
Échelle de bruit de Laplace | Float | >= 0.0 f | Obligatoire | 0.0f | Échelle de la distribution laplacien à partir de laquelle le bruit est échantillonné |
Parmi les fonctionnalités de sortie | OutputFeatureType | Obligatoire | BothCountsAndLogOdds | Les fonctionnalités à générer | |
Ignorer la colonne d'interruption | Boolean | Obligatoire | false | Indique s’il faut ignorer la colonne IsBackOff dans la sortie |
Sorties
Nom | Type | Description |
---|---|---|
Transformation modifiée | Interface ITransform | Transformation modifiée |
Exceptions
Exception | Description |
---|---|
Erreur 0003 | Cette exception se produit si une ou plusieurs entrées sont null ou vide. |
Erreur 0086 | Une exception se produit lorsqu’une transformation de comptage n’est pas valide. |
pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.
pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.