Naive Bayes 모델 탐색(기본 데이터 마이닝 자습서)
Microsoft Naive Bayes 알고리즘에서는 자전거 구매와 입력 특성 간의 상호 작용을 표시하는 여러 가지 방법을 제공합니다.
Microsoft Naive Bayes 뷰어는 Naive Bayes 마이닝 모델 탐색 시 사용할 수 있는 다음과 같은 탭을 제공합니다.
종속성 네트워크
특성 프로필
특성 특징
특성 판별
다음 섹션에서는 다른 마이닝 모델을 탐색하는 방법을 설명합니다.
종속성 네트워크
종속성 네트워크 탭은 Microsoft 트리 뷰어의 종속성 네트워크 탭과 동일한 방식으로 작동합니다. 뷰어의 각 노드는 특성을, 노드 사이의 선은 관계를 나타냅니다. 뷰어에서 예측 가능한 특성인 Bike Buyer의 상태에 영향을 주는 특성을 모두 확인할 수 있습니다.
종속성 네트워크 탭에서 모델을 탐색하려면
마이닝 모델 뷰어 탭 위쪽의 마이닝 모델 목록을 사용하여 TM_NaiveBayes 모델로 전환할 수 있습니다.
뷰어 목록을 사용하여 Microsoft Naive Bayes 뷰어로 전환합니다.
Bike Buyer 노드를 클릭하여 해당 종속성을 식별합니다.
분홍색 음영은 모든 특성이 자전거 구매에 영향을 준다는 것을 나타냅니다.
슬라이더를 조정하여 가장 큰 영향을 주는 특성을 식별합니다.
슬라이더를 내리면 [Bike Buyer] 열에 가장 큰 영향을 주는 특성만 남습니다. 슬라이더를 조정하여 소유 차량 대수, 통근 거리 및 총 자녀 수가 가장 영향을 주는 특성 중 일부임을 알 수 있습니다.
맨 위로 이동
특성 프로필
특성 프로필 탭은 여러 입력 특성 상태가 예측 가능한 특성의 결과에 어떻게 영향을 주는지 설명합니다.
특성 프로필 탭에서 모델을 탐색하려면
예측 가능 상자에서 Bike Buyer가 선택되어 있는지 확인합니다.
마이닝 범례가 특성 프로필의 표시를 차단하고 있는 경우 마이닝 범례를 다른 위치로 이동합니다.
히스토그램 막대 상자에서 5를 선택합니다.
이 모델에서 5는 어느 한 변수의 상태에 지정할 수 있는 최대값입니다.
입력 특성의 각 상태 값 및 해당 특성이 예측 가능한 특성의 각 상태에서 가지는 분포와 함께 이 예측 가능 특성의 상태에 영향을 주는 특성이 나열됩니다.
특성 열에서 Number Cars Owned를 찾습니다. 히스토그램에서 자전거 구매자(레이블이 1인 열)와 비구매자(레이블이 0인 열) 간의 차이를 확인하십시오. 차가 한 대 있거나 한 대도 없는 사람이 자전거를 구매할 확률이 더 높습니다.
자전거 구매자(레이블이 1인 열) 열에서 Number Cars Owned 셀을 두 번 클릭합니다.
마이닝 범례에서 보다 자세한 뷰를 표시합니다.
맨 위로 이동
특성 특징
특성 특징 탭을 사용하면 특성과 값을 선택하여 다른 특성의 값이 선택한 값 사례에 얼마나 자주 나타나는지 확인할 수 있습니다.
특성 특징 탭에서 모델을 탐색하려면
특성 목록에서 Bike Buyer가 선택되어 있는지 확인합니다.
값을 1로 설정합니다.
뷰어에서 자녀가 없고, 통근 거리가 짧고, 북미 지역에 사는 고객이 자전거를 구매할 가능성이 더 많음을 알 수 있습니다.
맨 위로 이동
특성 판별
특성 판별 탭을 사용하면 자전거 구매의 두 불연속 값과 기타 특성 값 사이의 관계를 조사할 수 있습니다. TM_NaiveBayes 모델에 있는 상태가 두 개, 즉 1과 0뿐이므로 뷰어를 변경하지 않아도 됩니다.
뷰어에서 차량을 소유하지 않은 사람들이 자전거를 구매하고 두 대의 차량을 소유한 사람들이 자전거를 구매하지 않는 경향이 있음을 확인할 수 있습니다.