다음을 통해 공유


OneHotHashEncodingEstimator 클래스

정의

범주 값의 하나 이상의 입력 열을 해시 기반 원 핫 인코딩 벡터의 많은 출력 열로 변환합니다.

public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
    interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
상속
OneHotHashEncodingEstimator
구현

설명

예측 도구 특성

이 추정기는 매개 변수를 학습하기 위해 데이터를 확인해야 합니까?
입력 열 데이터 형식 숫자, 부울, 텍스트 또는 형식의 스칼라 또는 벡터입니다.
출력 열 데이터 형식 의 스칼라 또는 벡터 또는 형식의 Single 벡터입니다.
ONNX로 내보낼 수 있습니다. 아니요

그 결과 OneHotEncodingTransformer 하나 이상의 입력 열을 하나의 핫 인코딩된 벡터의 출력 열로 변환합니다. 여기서 인덱싱은 값을 해시하고 해시를 인덱스로 사용하여 수행됩니다.

범주 OneHotEncodingEstimator 데이터를 기계 학습 알고리즘에 제공할 수 있는 양식으로 변환하는 데 자주 사용됩니다.

이 변환의 출력은 다음으로 OneHotEncodingEstimator.OutputKind지정됩니다.

  • Indicator 는 표시기 벡터를 생성합니다. 이 벡터의 각 슬롯은 사전의 범주에 해당하므로 길이는 작성된 사전의 크기입니다. 사전에 값을 찾을 수 없는 경우 출력은 0 벡터입니다.

  • Bag 는 각 슬롯이 입력 벡터에 해당 값의 발생 횟수를 저장하는 벡터 하나를 생성합니다. 이 벡터의 각 슬롯은 사전의 값에 해당하므로 길이는 기본 제공 사전의 크기입니다. Indicator 입력 Bag 열의 개별 슬롯에서 생성된 비트 벡터가 집계되는 방식과 차이점이 있습니다. 지표의 경우 연결되고 Bag의 경우 추가됩니다. 원본 열이 스칼라인 경우 표시기 및 모음 옵션은 동일합니다.

  • Key 는 열에 키를 생성 KeyDataViewType 합니다. 입력 열이 벡터인 경우 출력에는 벡터의 각 슬롯이 입력 벡터의 각 슬롯에 해당하는 벡터 형식이 포함됩니다. 기본 제공 사전에서 범주를 찾을 수 없는 경우 값 0이 할당됩니다.

  • Binary 는 입력 열에 있는 사전에 있는 값을 나타내는 이진 인코딩된 벡터를 생성합니다. 입력 열의 값을 사전에 찾을 수 없는 경우 출력은 0 벡터입니다.

OneHotEncodingTransformer는 하나 이상의 열에 적용할 수 있습니다. 이 경우 적용된 각 열에 대해 별도의 사전을 빌드하고 사용합니다.

사용 예제에 대한 링크는 참고 섹션을 참조하세요.

메서드

Fit(IDataView)

를 학습하고 반환합니다 OneHotHashEncodingTransformer.

GetOutputSchema(SchemaShape)

변환기에서 SchemaShape 생성할 스키마를 반환합니다. 파이프라인에서 스키마 전파 및 확인에 사용됩니다.

확장 메서드

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 추정기가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점을 두는 것이 유용합니다.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

추정기가 지정된 경우 대리자를 호출한 후 Fit(IDataView) 호출되는 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요한 경우가 많습니다. 따라서 Fit(IDataView) 메서드는 일반 ITransformer개체가 아닌 특별히 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 개체가 많은 파이프라인으로 형성되는 경우가 많으므로 변압기를 가져올 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수도 있습니다. 이 시나리오에서는 fit이 호출되면 호출되는 대리자를 이 메서드를 통해 연결할 수 있습니다.

적용 대상

추가 정보