ClusteringCatalog.CrossValidate Méthode
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Exécutez la validation croisée sur numberOfFolds
les replis de data
, en ajustant estimator
et en respectant samplingKeyColumnName
le cas échéant.
Évaluez ensuite chaque sous-modèle labelColumnName
et retournez les métriques.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))
Paramètres
- data
- IDataView
Données sur utilisant la validation croisée.
- estimator
- IEstimator<ITransformer>
Estimateur à ajuster.
- numberOfFolds
- Int32
Nombre de plis de validation croisée.
- labelColumnName
- String
Colonne d’étiquette facultative pour l’évaluation (les tâches de clustering peuvent ne pas toujours avoir une étiquette).
- featuresColumnName
- String
Colonne de fonctionnalités facultatives pour l’évaluation (nécessaire pour calculer la métrique Dbi)
- samplingKeyColumnName
- String
Nom d’une colonne à utiliser pour regrouper les lignes. Si deux exemples partagent la même valeur samplingKeyColumnName
, ils sont garantis d’apparaître dans le même sous-ensemble (entraîner ou tester). Cela peut être utilisé pour garantir qu’aucune fuite d’étiquette entre le train et le jeu de test.
Si null
aucun regroupement de lignes n’est effectué.
Valeur initiale du générateur de nombres aléatoires utilisé pour sélectionner des lignes pour les plis de validation croisée.