Condividi tramite


ClusteringCatalog.CrossValidate Metodo

Definizione

Eseguire la convalida incrociata sulle numberOfFolds piegazioni di data, estimatoradattando e rispettando samplingKeyColumnName se specificato. Valutare quindi ogni sub-modello rispetto labelColumnName alle metriche restituite.

public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))

Parametri

data
IDataView

Dati su cui eseguire la convalida incrociata.

estimator
IEstimator<ITransformer>

Valore di stima da adattare.

numberOfFolds
Int32

Numero di volte di convalida incrociata.

labelColumnName
String

Colonna di etichetta facoltativa per la valutazione (le attività di clustering potrebbero non avere sempre un'etichetta).

featuresColumnName
String

Colonna delle funzionalità facoltative per la valutazione (necessaria per il calcolo della metrica Dbi)

samplingKeyColumnName
String

Nome di una colonna da usare per raggruppare le righe. Se due esempi condividono lo stesso valore di samplingKeyColumnName, sono garantiti che vengano visualizzati nello stesso subset (training o test). Questa operazione può essere usata per garantire che nessuna perdita di etichette dal training al set di test. Se null non verrà eseguito alcun raggruppamento di righe.

seed
Nullable<Int32>

Inizializzazione per il generatore di numeri casuali usato per selezionare le righe per le piegazioni di convalida incrociata.

Restituisce

Si applica a