ClusteringCatalog.CrossValidate Método
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Ejecute la validación cruzada en numberOfFolds
plegamientos de data
, ajustando estimator
y respetando samplingKeyColumnName
si se proporciona.
A continuación, evalúe cada submodelo con labelColumnName
y devuelva métricas.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))
Parámetros
- data
- IDataView
Datos en los que se ejecutará la validación cruzada.
- estimator
- IEstimator<ITransformer>
Estimador que se va a ajustar.
- numberOfFolds
- Int32
Número de plegamientos de validación cruzada.
- labelColumnName
- String
Columna de etiqueta opcional para la evaluación (es posible que las tareas de agrupación en clústeres no siempre tengan una etiqueta).
- featuresColumnName
- String
Columna de características opcionales para la evaluación (necesaria para calcular la métrica Dbi)
- samplingKeyColumnName
- String
Nombre de una columna que se va a usar para agrupar filas. Si dos ejemplos comparten el mismo valor de samplingKeyColumnName
, se garantiza que aparecen en el mismo subconjunto (entrenamiento o prueba). Esto se puede usar para garantizar que no se filte ninguna etiqueta del tren al conjunto de pruebas.
Si null
no se realizará ninguna agrupación de filas.
Inicialización del generador de números aleatorios usado para seleccionar filas para plegamientos de validación cruzada.