ClusteringCatalog.CrossValidate Método
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Execute a validação cruzada em numberOfFolds
dobras de data
, ajustando estimator
e respeitando samplingKeyColumnName
se fornecido.
Em seguida, avalie cada subexame e labelColumnName
retorne métricas.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))
Parâmetros
- data
- IDataView
Os dados em que executar a validação cruzada.
- estimator
- IEstimator<ITransformer>
O estimador a ser ajustado.
- numberOfFolds
- Int32
Número de dobras de validação cruzada.
- labelColumnName
- String
Coluna de rótulo opcional para avaliação (tarefas de clustering nem sempre podem ter um rótulo).
- featuresColumnName
- String
Coluna de recursos opcionais para avaliação (necessária para calcular a métrica Dbi)
- samplingKeyColumnName
- String
Nome de uma coluna a ser usada para agrupar linhas. Se dois exemplos compartilharem o mesmo valor do samplingKeyColumnName
, eles têm a garantia de aparecer no mesmo subconjunto (treinar ou testar). Isso pode ser usado para garantir que nenhum vazamento de rótulo do trem para o conjunto de testes.
Se null
nenhum agrupamento de linhas for executado.
Semente para o gerador de número aleatório usado para selecionar linhas para dobras de validação cruzada.