Partager via


Entraîner un modèle de clustering

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Forme un modèle de clustering et assigne des données du jeu d'apprentissage aux clusters

catégorie : Machine Learning/Train

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module former le modèle de clustering dans Machine Learning Studio (classic) pour effectuer l’apprentissage d’un modèle de clustering.

Le module prend un modèle de clustering non entraîné que vous avez déjà configuré à l’aide du module Clustering k-moyennes et l’entraîne à l’aide d’un jeu de données étiqueté ou sans étiquette. Le module crée à la fois un modèle entraîné que vous pouvez utiliser à des fins de prédiction et un ensemble d’affectations de cluster pour chaque cas dans les données d’apprentissage.

Notes

Un modèle de clustering ne peut pas être formé à l’aide du module former le modèle , qui est le module générique pour la création de modèles de machine learning. Cela est dû au fait que le module Train Model (Entraîner le modèle) fonctionne uniquement avec les algorithmes d’apprentissage supervisé. L’algorithme de clustering k-moyennes et les autres algorithmes de clustering permettent un apprentissage non supervisé, ce qui signifie que l’algorithme peut apprendre à partir de données sans étiquette.

Entraînement d’un modèle de clustering

  1. Ajoutez le module former le modèle de clustering à votre expérience dans Studio (Classic). Vous trouverez ce module sous Modules Machine Learning, dans la catégorie Entraîner.

  2. Ajouter le module Clustering k-moyennes ou un autre module personnalisé qui crée un modèle de clustering compatible, puis définissez les paramètres du modèle de clustering.

  3. Joignez un jeu de données d’entraînement à l’entrée à droite du module Train Clustering Model (Entraîner un modèle de clustering).

  4. Dans Jeu de colonnes, sélectionnez les colonnes du jeu de données à utiliser lors de la création de clusters. Veillez à sélectionner les colonnes qui constituent de bonnes fonctionnalités : par exemple, évitez d’utiliser les ID ou d’autres colonnes qui ont des valeurs uniques ou des colonnes qui ont toutes les mêmes valeurs.

    Si une étiquette est disponible, vous pouvez l’utiliser comme une fonctionnalité ou l’ignorer.

  5. Sélectionnez l’option Activer l' Ajout ou la désactivation du résultat uniquementsi vous souhaitez générer les données d’apprentissage en même temps que la nouvelle étiquette de cluster.

    Si vous désélectionnez cette option, seuls les affectations de cluster sont générées.

  6. Exécutez l’expérience, ou cliquez sur le module Train Clustering Model (Entraîner un modèle de clustering) et sélectionnez Exécuter la sélection.

Résultats

Une fois l’apprentissage terminé :

  • Pour afficher le cluster et sa séparation dans un graphique, cliquez avec le bouton droit sur la sortie du jeu de données de résultats et sélectionnez visualiser.

    Le graphique représente les principaux composants du cluster, plutôt que les valeurs réelles. Pour plus d’informations, consultez analyse des composants principaux .

  • Pour afficher les valeurs dans le DataSet, ajoutez une instance du module Convert to DataSet et connectez-la à la sortie du jeu de données de résultats . Exécutez le module Convert to DataSet pour obtenir une copie des données que vous pouvez afficher ou télécharger.

  • Pour enregistrer le modèle entraîné en vue d’une réutilisation ultérieure, cliquez sur le module, sélectionnez Modèle formé, puis cliquez sur Save As Trained Model (Enregistrer en tant que modèle formé).

  • Pour générer des scores à partir du modèle, utilisez l’option Attribuer des données à des clusters.

Exemples

Pour obtenir un exemple d’utilisation du clustering dans Machine Learning, consultez la Azure ai Gallery:

Entrées attendues

Nom Type Description
Untrained model (Modèle non entraîné) Interface ICluster Modèle de clustering non formé
Dataset Table de données Source de données d'entrée

Paramètres du module

Nom Plage Type Default Description
Jeu de colonnes n'importe laquelle ColumnSelection Mode de sélection de colonne
Activer la case pour Ajouter ou désactiver la case pour Résultat uniquement n'importe laquelle Boolean true Détermine si un jeu de données de sortie doit contenir un jeu de données d'entrée ajouté par la colonne d'affectations (activé), ou uniquement la colonne d'affectations (désactivé)

Sorties

Nom Type Description
Modèle entraîné Interface ICluster Modèle de clustering formé
Jeu de données de résultats Table de données Jeu de données d'entrée ajouté par la colonne de données d'affectations, ou uniquement la colonne d'affectations

Exceptions

Exception Description
Erreur 0003 Cette exception se produit si une ou plusieurs entrées sont null ou vide.

pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.

pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.

Voir aussi

Liste alphabétique des modules
Entraîner
Attribuer des données à des clusters
Clustering k-moyennes