데이터 변환 - 크기 조정 및 축소
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
이 문서에서는 숫자 데이터를 사용하는 데 도움이 되는 Machine Learning Studio(클래식)의 모듈에 대해 설명합니다. 기계 학습의 경우 일반적인 데이터 작업에는 숫자 값 클리핑, 범주화 및 정규화가 포함됩니다. 다른 모듈은 차원 감소를 지원합니다.
숫자 데이터 모델링
숫자 변수 정규화, 범주화 또는 재배포와 같은 작업은 기계 학습을 위한 데이터 준비의 중요한 부분입니다. 이 그룹의 모듈은 다음 데이터 준비 작업을 지원합니다.
- 데이터를 다양한 크기 또는 배포의 bin으로 그룹화합니다.
- 이상값을 제거하거나 값을 변경합니다.
- 숫자 값 집합을 특정 범위로 정규화합니다.
- 고차원 데이터 세트에서 기능 열의 압축 집합을 만듭니다.
관련 작업
- 모델 빌드에 사용할 관련 유용한 기능을 선택합니다. 기능 선택 또는 피셔 선형 비범죄 분석 모듈을 사용합니다.
- 값 개수에 따라 기능을 선택합니다. Counts 모듈에서 Learning 사용합니다.
- 누락된 값 제거 또는 바꾸기: 누락된 데이터 정리 모듈을 사용합니다.
- 범주 값을 계산에서 파생된 숫자 값으로 바꿉니다. 불연속 값 바꾸기 모듈을 사용합니다.
- 불연속 또는 숫자 열에 대한 확률 분포 계산: 확률 함수 평가 모듈을 사용합니다.
- 디지털 신호 및 파형 필터링 및 변환: 필터 모듈을 사용합니다.
모듈 목록
이 데이터 변환 - 크기 조정 및 축소 범주에는 다음 모듈이 포함됩니다.
- 클립 값: 이상값을 검색한 다음 해당 값을 클리핑하거나 대체합니다.
- Bin으로 데이터 그룹화: 숫자 데이터를 bin에 넣습니다.
- 데이터 정규화: 데이터 세트 값을 표준 범위로 제한하도록 숫자 데이터의 크기를 조정합니다.
- 주요 구성 요소 분석: 보다 효율적인 학습을 위해 차원성을 줄인 기능 집합을 계산합니다.