Partilhar via


OneHotHashEncodingEstimator Classe

Definição

Converte uma ou mais colunas de entrada de valores categóricos em tantas colunas de saída de vetores codificados com um hot baseados em hash.

public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
    interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
Herança
OneHotHashEncodingEstimator
Implementações

Comentários

Características do estimador

Esse estimador precisa examinar os dados para treinar seus parâmetros? Sim
Tipo de dados de coluna de entrada Escalar ou vetor de tipo numérico, booliano, texto ou chave .
Tipo de dados de coluna de saída Escalar ou vetor de chave ou vetor do Single tipo.
Exportável para ONNX No

O resultado OneHotEncodingTransformer converte uma ou mais colunas de entrada em tantas colunas de saída de vetores codificados de um hot, em que a indexação é feita por hash do valor e usando o hash como um índice.

Geralmente OneHotEncodingEstimator , eles são usados para converter dados categóricos em um formulário que pode ser fornecido a um algoritmo de aprendizado de máquina.

A saída dessa transformação é especificada por OneHotEncodingEstimator.OutputKind:

  • Indicator produz um vetor indicador. Cada slot nesse vetor corresponde a uma categoria no dicionário, portanto, o respectivo comprimento é o tamanho do dicionário criado. Se um valor não for encontrado no dicionário, a saída será o vetor zero.

  • Bag produz um vetor de modo que cada slot armazene o número de ocorrências do valor correspondente no vetor de entrada. Cada slot nesse vetor corresponde a um valor no dicionário, portanto, seu tamanho é o tamanho do dicionário criado. Indicator e Bag diferem simplesmente em como os vetores de bit gerados de slots individuais na coluna de entrada são agregados: para Indicador, eles são concatenados e, para Bag, eles são adicionados. Quando a coluna de origem é escalar, as opções Indicador e Saco são idênticas.

  • Key produz chaves em uma KeyDataViewType coluna. Se a coluna de entrada for um vetor, a saída conterá um tipo de chave de vetor, em que cada slot do vetor corresponde ao respectivo slot do vetor de entrada. Se uma categoria não for encontrada no dicionário interno, ela será atribuída ao valor zero.

  • Binary produz um vetor codificado binário para representar os valores encontrados no dicionário que estão presentes na coluna de entrada. Se um valor na coluna de entrada não for encontrado no dicionário, a saída será o vetor zero.

O OneHotEncodingTransformer pode ser aplicado a uma ou mais colunas, nesse caso, ele cria e usa um dicionário separado para cada coluna à qual ele é aplicado.

Verifique a seção Consulte Também para obter links para exemplos de uso.

Métodos

Fit(IDataView)

Treina e retorna um OneHotHashEncodingTransformer.

GetOutputSchema(SchemaShape)

Retorna o SchemaShape esquema que será produzido pelo transformador. Usado para propagação e verificação de esquema em um pipeline.

Métodos de Extensão

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Acrescente um "ponto de verificação de cache" à cadeia de estimativas. Isso garantirá que os estimadores downstream serão treinados em relação aos dados armazenados em cache. É útil ter um ponto de verificação de cache antes dos treinadores que fazem várias passagens de dados.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dado um estimador, retorne um objeto de encapsulamento que chamará um delegado uma vez Fit(IDataView) chamado. Geralmente, é importante que um estimador retorne informações sobre o que estava em forma, e é por isso que o Fit(IDataView) método retorna um objeto especificamente tipado, em vez de apenas um geral ITransformer. No entanto, ao mesmo tempo, IEstimator<TTransformer> muitas vezes são formados em pipelines com muitos objetos, portanto, talvez seja necessário construir uma cadeia de estimadores por meio EstimatorChain<TLastTransformer> de onde o estimador para o qual queremos que o transformador seja enterrado em algum lugar nesta cadeia. Para esse cenário, podemos por meio desse método anexar um delegado que será chamado quando fit for chamado.

Aplica-se a

Confira também