SELECT DISTINCT FROM <모델 > (DMX)
적용 대상: SQL Server Analysis Services
모델에서 선택한 열에 대해 가능한 모든 상태를 반환합니다. 반환되는 값은 지정된 열에 불연속 값, 불연속 숫자 값 또는 연속 숫자 값이 포함되어 있는지 여부에 따라 달라집니다.
구문
SELECT [FLATTENED] DISTINCT [TOP <n>] <expression list> FROM <model>
[WHERE <condition list>][ORDER BY <expression>]
인수
n
선택 사항. 반환할 행 수를 지정하는 정수입니다.
식 목록
관련 열 식별자(모델에서 파생됨) 또는 식의 쉼표로 구분된 목록입니다.
model
모델 식별자입니다.
조건 목록
열 목록에서 반환되는 값을 제한하는 조건입니다.
expression
선택 사항. 스칼라 값을 반환하는 식입니다.
설명
SELECT DISTINCT FROM 문은 단일 열 또는 관련 열 집합에서만 작동합니다. 이 절은 관련 없는 열 집합에서 작동하지 않습니다.
SELECT DISTINCT FROM 문을 사용하면 중첩 테이블 내의 열을 직접 참조할 수 있습니다. 예시:
<model>.<table column reference>.<column reference>
SELECT DISTINCT FROM <모델> 문의 결과는 열 형식에 따라 달라집니다. 다음 표에서는 지원되는 열 형식 및 문의 출력에 대해 설명합니다.
열 유형 | 출력 |
---|---|
불연속 | 열의 고유 값입니다. |
불연속화된 | 열에서 불연속화된 각 버킷의 중간점입니다. |
연속 | 열에서 값의 중간점 |
불연속 열 예제
다음 코드 샘플은 기본 데이터 마이닝 자습서에서 만든 모델을 기반으로 [TM Decision Tree]
합니다. 이 쿼리는 불연속 열 Gender
에 있는 고유 값을 반환합니다.
SELECT DISTINCT [Gender]
FROM [TM Decision Tree]
결과 예:
성별 |
---|
F |
M |
불연속 값이 포함된 열의 경우 결과에는 항상 Null 값으로 표시된 누락 상태가 포함됩니다.
연속 열의 예
다음 코드 샘플에서는 열의 모든 값에 대한 중간점, 최소 기간 및 최대 기간을 반환합니다.
SELECT DISTINCT [Age] AS [Midpoint Age],
RangeMin([Age]) AS [Minimum Age],
RangeMax([Age]) AS [Maximum Age]
FROM [TM Decision Tree]
결과 예:
미드포인트 에이지 | 최소 연령 | 최대 보존 기간 |
---|---|---|
62 | 26 | 97 |
또한 쿼리는 누락된 값을 나타내기 위해 null 값의 단일 행을 반환합니다.
불연속 열 예제
다음 코드 샘플은 열 [Yearly Income]
에 대한 알고리즘에 의해 만들어진 각 버킷의 중간점, 최대값 및 최소값을 반환합니다. 이 예의 결과를 재현하려면 [Targeted Mailing]
과 동일한 새 마이닝 구조를 만들어야 합니다. 마법사에서 열의 콘텐츠 형식을 연속에서 불연속화로 변경합니다. Yearly Income
참고 항목
기본 마이닝 자습서에서 만든 마이닝 모델을 변경하여 마이닝 구조 열을 [Yearly Income]
불연속화할 수도 있습니다. 이 작업을 수행하는 방법에 대한 자세한 내용은 마이닝 모델에서 열의 불연속화 변경을 참조 하세요. 그러나 열의 불연속화를 변경하면 마이닝 구조가 강제로 다시 처리되므로 해당 구조를 사용하여 빌드한 다른 모델의 결과가 변경됩니다.
SELECT DISTINCT [Yearly Income] AS [Bucket Average],
RangeMin([Yearly Income]) AS [Bucket Minimum],
RangeMax([Yearly Income]) AS [Bucket Maximum]
FROM [TM Decision Tree]
결과 예:
버킷 평균 | Bucket Minimum | 버킷 최대값 |
---|---|---|
24610.7 | 10000 | 39221.41 |
55115.73 | 39221.41 | 71010.05 |
84821.54 | 71010.05 | 98633.04 |
111633.9 | 98633.04 | 124634.7 |
147317.4 | 124634.7 | 170000 |
열 값이 5개의 버킷과 null 값의 [Yearly Income]
추가 행으로 분할되어 누락된 값을 나타내는 것을 볼 수 있습니다.
결과의 소수 자릿수는 쿼리에 사용하는 클라이언트에 따라 달라집니다. 여기서는 단순성과 SSDT(SQL Server Data Tools)에 표시되는 값을 반영하기 위해 두 개의 소수 자릿수로 반올림되었습니다.
예를 들어 의사 결정 트리 뷰어를 사용하여 모델을 찾아보고 소득별로 그룹화된 고객이 포함된 노드를 클릭하면 도구 설명에 다음 노드 속성이 표시됩니다.
Age >=69 and Yearly Income < 39221.41
참고 항목
최소 버킷의 최소값과 최대 버킷의 최대값은 단순히 관측 값 중 가장 높은 값과 가장 낮은 값입니다. 이 관찰된 범위를 벗어나는 모든 값은 최소 및 최대 버킷에 속하는 것으로 간주됩니다.
참고 항목
SELECT(DMX)
DMX(데이터 마이닝 확장) 데이터 조작 문
DMX(Data Mining Extensions) 문 참조