Partager via


ClusteringCatalog.CrossValidate Méthode

Définition

Exécutez la validation croisée sur numberOfFolds les replis de data, en ajustant estimatoret en respectant samplingKeyColumnName le cas échéant. Évaluez ensuite chaque sous-modèle labelColumnName et retournez les métriques.

public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))

Paramètres

data
IDataView

Données sur utilisant la validation croisée.

estimator
IEstimator<ITransformer>

Estimateur à ajuster.

numberOfFolds
Int32

Nombre de plis de validation croisée.

labelColumnName
String

Colonne d’étiquette facultative pour l’évaluation (les tâches de clustering peuvent ne pas toujours avoir une étiquette).

featuresColumnName
String

Colonne de fonctionnalités facultatives pour l’évaluation (nécessaire pour calculer la métrique Dbi)

samplingKeyColumnName
String

Nom d’une colonne à utiliser pour regrouper les lignes. Si deux exemples partagent la même valeur samplingKeyColumnName, ils sont garantis d’apparaître dans le même sous-ensemble (entraîner ou tester). Cela peut être utilisé pour garantir qu’aucune fuite d’étiquette entre le train et le jeu de test. Si null aucun regroupement de lignes n’est effectué.

seed
Nullable<Int32>

Valeur initiale du générateur de nombres aléatoires utilisé pour sélectionner des lignes pour les plis de validation croisée.

Retours

S’applique à