Compartir a través de


ClusteringCatalog.CrossValidate Método

Definición

Ejecute la validación cruzada en numberOfFolds plegamientos de data, ajustando estimatory respetando samplingKeyColumnName si se proporciona. A continuación, evalúe cada submodelo con labelColumnName y devuelva métricas.

public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))

Parámetros

data
IDataView

Datos en los que se ejecutará la validación cruzada.

estimator
IEstimator<ITransformer>

Estimador que se va a ajustar.

numberOfFolds
Int32

Número de plegamientos de validación cruzada.

labelColumnName
String

Columna de etiqueta opcional para la evaluación (es posible que las tareas de agrupación en clústeres no siempre tengan una etiqueta).

featuresColumnName
String

Columna de características opcionales para la evaluación (necesaria para calcular la métrica Dbi)

samplingKeyColumnName
String

Nombre de una columna que se va a usar para agrupar filas. Si dos ejemplos comparten el mismo valor de samplingKeyColumnName, se garantiza que aparecen en el mismo subconjunto (entrenamiento o prueba). Esto se puede usar para garantizar que no se filte ninguna etiqueta del tren al conjunto de pruebas. Si null no se realizará ninguna agrupación de filas.

seed
Nullable<Int32>

Inicialización del generador de números aleatorios usado para seleccionar filas para plegamientos de validación cruzada.

Devoluciones

Se aplica a