MulticlassClassificationCatalog.CrossValidate Método
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Execute a validação cruzada em numberOfFolds
dobras de data
, ajustando estimator
e respeitando samplingKeyColumnName
se fornecido.
Em seguida, avalie cada subconjunto em relação labelColumnName
às métricas e retorne.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.MulticlassClassificationMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = "Label", string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.MulticlassClassificationMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = "Label", Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of MulticlassClassificationMetrics))
Parâmetros
- data
- IDataView
Os dados em que executar a validação cruzada.
- estimator
- IEstimator<ITransformer>
O avaliador a ser ajustado.
- numberOfFolds
- Int32
Número de dobras de validação cruzada.
- labelColumnName
- String
A coluna de rótulo (para avaliação).
- samplingKeyColumnName
- String
Nome de uma coluna a ser usada para agrupar linhas. Se dois exemplos compartilham o mesmo valor do , eles têm a garantia de samplingKeyColumnName
aparecer no mesmo subconjunto (treinar ou testar). Isso pode ser usado para garantir que nenhum vazamento de rótulo do trem para o conjunto de testes.
Se null
nenhum agrupamento de linhas for executado.
Semente para o gerador de número aleatório usado para selecionar linhas para dobras de validação cruzada.
Retornos
Resultados por dobra: métricas, modelos, conjuntos de dados pontuados.