MutualInformationFeatureSelectingEstimator 클래스
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
레이블 열(지정된 열의 값을 관찰하여 레이블에 대해 알아볼 수 있는 항목)을 사용하여 상호 정보로 정렬된 지정된 모든 열에서 상위 k 슬롯을 선택합니다.
public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type MutualInformationFeatureSelectingEstimator = class
interface IEstimator<ITransformer>
Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
- 상속
-
MutualInformationFeatureSelectingEstimator
- 구현
설명
예측 도구 특성
이 예측 도구는 매개 변수를 학습하기 위해 데이터를 확인해야 합니까? | Yes |
입력 열 데이터 형식 | 숫자, 텍스트 또는 키 데이터 형식의 벡터 또는 스칼라 |
출력 열 데이터 형식 | 입력 열과 동일 |
ONNX로 내보낼 수 있습니다. | Yes |
공식적으로 상호 정보는 다음과 같이 작성될 수 있습니다.
$\text{MI}(X,Y) = E_{x,y}[\log(P(x,y)) - \log(P(x)) - \log(P(y)]$ 여기서 $x$ 및 $y$는 임의 변수 $X$ 및 $Y$를 관찰합니다.
여기서 기대 E는 X와 Y의 공동 분포를 인수합니다. 여기서 P(x, y)는 X와 Y의 공동 확률 밀도 함수이며, P(x) 및 P(y)는 각각 X와 Y의 한계 확률 밀도 함수입니다. 일반적으로 종속 변수(또는 레이블)와 독립 변수(또는 기능) 간의 상호 정보가 높으면 레이블이 해당 기능에 대한 상호 의존도가 높아집니다. 레이블과 함께 가장 큰 상호 정보를 사용하여 출력 기능의 상위 슬롯을 유지합니다.
예를 들어 다음 기능 및 레이블 열의 경우 레이블 열과 상관 관계가 높은 상위 2개 슬롯(벡터 요소)을 지정하면 값이 Label 열의 값과 더 상관 관계가 있으므로 이 Estimator를 적용하는 출력은 첫 번째 슬롯과 세 번째 슬롯만 유지합니다.
레이블 | 기능 |
---|---|
True | 4,6,0 |
False | 0,7,5 |
True | 4,7,0 |
False | 0,7,0 |
위의 데이터 세트는 예측 도구를 맞추고 결과 변환기를 사용하여 데이터를 변환한 후 다음과 같이 표시됩니다.
레이블 | 기능 |
---|---|
True | 4,0 |
False | 0,5 |
True | 4,0 |
False | 0,0 |
사용 예제에 대한 링크는 참고 항목 섹션을 참조하세요.
메서드
Fit(IDataView) |
를 학습하고 를 반환합니다 ITransformer. |
GetOutputSchema(SchemaShape) |
SchemaShape 변환기에서 생성할 스키마의 를 반환합니다. 파이프라인에서 스키마 전파 및 확인에 사용됩니다. |
확장 메서드
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 예측 도구가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있으면 도움이 됩니다. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
추정기가 지정된 경우 가 호출되면 Fit(IDataView) 대리자를 호출할 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요하기 때문에 Fit(IDataView) 메서드는 일반 ITransformer가 아닌 특별히 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 많은 개체가 있는 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져오려는 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 fit이 호출되면 호출될 대리자를 이 메서드를 통해 연결할 수 있습니다. |