ClusteringCatalog.CrossValidate Methode
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Führen Sie die Kreuzüberprüfung über numberOfFolds
Falten von data
, durch estimator
Anpassen und Respekt samplingKeyColumnName
aus, wenn angegeben.
Bewerten Sie dann jedes Teilmodell anhand labelColumnName
und zurückgeben von Metriken.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate(Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))
Parameter
- data
- IDataView
Die Daten zum Ausführen einer Kreuzüberprüfung.
- estimator
- IEstimator<ITransformer>
Der Schätzer, der passt.
- numberOfFolds
- Int32
Anzahl der Kreuzüberprüfungsfalten.
- labelColumnName
- String
Optionale Bezeichnungsspalte für die Auswertung (Clustering-Aufgaben verfügen möglicherweise nicht immer über eine Bezeichnung).
- featuresColumnName
- String
Optionale Featuresspalte für die Auswertung (erforderlich für die Berechnung der Dbi-Metrik)
- samplingKeyColumnName
- String
Name einer Spalte, die zum Gruppieren von Zeilen verwendet werden soll. Wenn zwei Beispiele den gleichen Wert des samplingKeyColumnName
Werts teilen, werden sie garantiert in derselben Teilmenge (Train oder Test) angezeigt. Dies kann verwendet werden, um sicherzustellen, dass keine Etikettenlecks vom Zug bis zum Testsatz vorhanden sind.
Wenn null
keine Zeilengruppe ausgeführt wird.
Seed für den Zufallszahlengenerator, der zum Auswählen von Zeilen für Kreuzüberprüfungsfalten verwendet wird.