ClusteringCatalog.CrossValidate Metoda
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Spusťte křížové ověření nad numberOfFolds
přeložením data
, montáží estimator
a dodržováním samplingKeyColumnName
, pokud je k dispozici.
Pak vyhodnoťte jednotlivé dílčí modely a labelColumnName
vracejte metriky.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))
Parametry
- data
- IDataView
Data pro spuštění křížového ověření.
- estimator
- IEstimator<ITransformer>
Estimátor se hodí.
- numberOfFolds
- Int32
Počet záhybů křížového ověření
- labelColumnName
- String
Volitelný sloupec popisku pro vyhodnocení (úlohy clusteringu nemusí mít vždy popisek).
- featuresColumnName
- String
Sloupec volitelných funkcí pro vyhodnocení (potřebný pro výpočet metriky Dbi)
- samplingKeyColumnName
- String
Název sloupce, který se má použít pro seskupení řádků. Pokud dva příklady sdílejí stejnou hodnotu samplingKeyColumnName
, je zaručeno, že se zobrazí ve stejné podmnožině (trénování nebo testování). To lze použít k zajištění úniku štítků z trénování do testovací sady.
Pokud null
se neprovedou žádné seskupení řádků.
Počáteční pro generátor náhodných čísel, který se používá k výběru řádků pro křížové ověření přeložení.