1 단원: Bike Buyer 마이닝 구조 만들기
적용 대상: SQL Server 2016 Preview
이 단원에서는 Adventure Works Cycles의 잠재 고객이 자전거를 구입할 것인지 여부를 예측할 수 있는 마이닝 구조를 만듭니다. 마이닝 구조 및 데이터 마이닝에 해당 역할에 잘 알고 있지 않다면 참조 마이닝 구조 및 #40; Analysis Services-데이터 마이닝 및 #41;합니다.
이 단원에서 만들 Bike Buyer 마이닝 구조를 기반으로 하는 마이닝 모델 추가 지원는 Microsoft 클러스터링 알고리즘Microsoft 의사 결정 트리 알고리즘합니다. 이후 단원에서는 클러스터링 마이닝 모델을 사용하여 고객을 그룹화할 수 있는 다양한 방법을 탐색하고 의사 결정 트리 마이닝 모델을 사용하여 잠재 고객이 자전거를 구입할 것인지 여부를 예측합니다.
CREATE MINING STRUCTURE 문
마이닝 구조를 만들려면 사용 하는 마이닝 구조 만들기 ( DMX ) 문입니다. 이 문의 코드는 다음 부분으로 나눌 수 있습니다.
구조 이름을 지정합니다.
키 열을 정의합니다.
마이닝 열을 정의합니다.
선택적 테스트 데이터 집합을 정의합니다.
다음은 CREATE MINING STRUCTURE 문의 일반적인 예입니다.
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
WITH HOLDOUT (<holdout specifier>)
코드의 첫 번째 줄에서는 구조의 이름을 정의합니다.
CREATE MINING STRUCTURE [<mining structure name>]
개체에 확장 DMX (Data Mining) 이름을 지정 하는 방법에 대 한 정보를 참조 하십시오. 식별자 ( DMX )합니다.
코드의 다음 줄에서는 원본 데이터의 엔터티를 고유하게 식별하는 마이닝 구조에 대한 키 열을 정의합니다.
<key column>,
마이닝 구조에서 원본 데이터의 엔터티를 정의하는 고객 식별자(CustomerKey
)를 만듭니다.
코드의 다음 줄은 마이닝 구조와 연결된 마이닝 모델에서 사용할 마이닝 열을 정의하는 데 사용됩니다.
<mining structure columns>
DISCRETIZE 함수를 사용할 수 있습니다 를 다음 구문을 사용 하 여 연속 열을 분할 합니다.
DISCRETIZE(<method>,<number of buckets>)
열을 분할 하는 방법에 대 한 자세한 내용은 참조 분할 방법 ( 데이터 마이닝 속성 )합니다. 정의할 수 있는 마이닝 구조 열 유형에 대 한 자세한 내용은 참조 마이닝 구조 열합니다.
코드의 마지막 줄에서는 마이닝 구조의 선택적 파티션을 정의합니다.
WITH HOLDOUT (<holdout specifier>)
구조와 관련된 테스트 마이닝 모델에 사용할 일부 데이터를 지정하면 나머지 데이터는 모델 학습에 사용됩니다. 기본적으로 Analysis Services는 모든 사례 데이터의 30%를 포함하는 테스트 데이터 집합을 만듭니다. 테스트 데이터 집합이 사례의 30%(최대 1000개의 사례)를 포함해야 하는 사양을 추가합니다. 사례의 30%가 1000개보다 작으면 테스트 데이터 집합에 보다 적은 양이 포함됩니다.
단원 태스크
이 단원에서는 다음 태스크를 수행합니다.
비어 있는 새 쿼리를 만듭니다.
마이닝 구조를 만들기 위해 쿼리를 변경합니다.
쿼리를 실행합니다.
쿼리 만들기
첫 번째 단계는 Analysis Services 인스턴스에 연결하고 SQL Server Management Studio에서 새 DNX 쿼리를 만드는 것입니다.
SQL Server Management Studio에서 새 DMX 쿼리를 만들려면
SQL Server Management Studio열기
서버에 연결 대화 상자에서 서버 유형으로 Analysis Services를 선택합니다. 서버 이름, 형식 LocalHost, 인스턴스의 이름을 입력 하거나 Analysis Services 하려는 경우이 단원에 연결 합니다. 연결을 클릭합니다.
개체 탐색기, 의 인스턴스를 마우스 오른쪽 단추로 클릭 Analysis Services, 가리킨 새 쿼리, 를 클릭 하 고 DMX 를 열려면는 쿼리 편집기 및 비어 있는 새 쿼리 합니다.
쿼리 변경
다음 단계는 Bike Buyer 마이닝 구조를 만들기 위해 위에서 설명한 CREATE MINING STRUCTURE 문을 수정하는 것입니다.
CREATE MINING STRUCTURE 문을 사용자 지정하려면
쿼리 편집기에서 CREATE MINING STRUCTURE 문의 일반적인 예를 빈 쿼리에 복사합니다.
다음 내용을
[<mining structure>]
다음 구문으로 바꿉니다.
[Bike Buyer]
다음 내용을
<key column>
다음 구문으로 바꿉니다.
CustomerKey LONG KEY
다음 내용을
<mining structure columns>
다음 구문으로 바꿉니다.
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned] LONG DISCRETE, [Number Children At Home] LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS
다음 내용을
WITH HOLDOUT (holdout specifier>)
다음 구문으로 바꿉니다.
WITH HOLDOUT (30 PERCENT or 1000 CASES)
이제 전체 문이 다음과 같아야 합니다.
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS ) WITH HOLDOUT (30 PERCENT or 1000 CASES)
파일 메뉴에서 다른 이름으로 DMXQuery1.dmx 저장을 클릭합니다.
에 다른 이름으로 저장 대화 상자에서 적절 한 폴더로 이동 하 고 파일 이름을 Bike Buyer Structure.dmx합니다.
쿼리 실행
마지막 단계는 쿼리를 실행하는 것입니다. 쿼리를 만들고 저장한 다음에는 해당 쿼리를 실행해야 합니다. 즉, 서버에 마이닝 구조를 만들려면 해당 문을 실행해야 합니다. 쿼리 편집기에서 쿼리를 실행 하는 방법에 대 한 자세한 내용은 참조 데이터베이스 엔진 쿼리 편집기 ( SQL Server Management Studio )합니다.
쿼리를 실행하려면
쿼리 편집기의 도구 모음에서 실행을 클릭합니다.
문의 실행이 끝나면 쿼리 상태가 쿼리 편집기 아래쪽의 메시지 탭에 표시됩니다. 메시지는 다음과 같아야 합니다.
Executing the query Execution complete
라는 새 구조가 Bike Buyer 이제 서버에 존재 합니다.
다음 단원에서는 방금 만든 구조에 마이닝 모델을 추가합니다.