Macierz klasyfikacji (Analysis Services — wyszukiwanie danych)
The Classification Matrix tab of the Mining Accuracy Chart tab of wyszukiwanie danych Designer displays a matrix for each model that you specify in the Input Selection tab.Przeglądając ten wykres, który jest czasami nazywane Macierz pomyłek, można szybko zobaczyć, jak często dokładnie przewidzieć modelu.
Wiersze dla każdego macierzy reprezentuje przewidywane wartości dla modelu, w kolumnach odzwierciedlają rzeczywiste wartości.Macierz klasyfikacji jest tworzony przez sortowania wszystkich przypadkach w kategorie: czy przewidywane wartości dopasowania wartości rzeczywistych i czy przewidywane wartości był poprawny lub niepoprawne. Kategorie te są czasami określane jako fałszywie dodatnie., wartość true dodatnie, ujemna wartość false, and ujemna wartość true.Następnie uwzględniane są wszystkie przypadki, w każdej kategorii, a sumy są wyświetlane w macierzy.
W tej sekcji wyjaśniono, jak utworzyć macierzy klasyfikacji i sposób interpretacji wyniki.
Uwaga
Macierz klasyfikacji mogą być używane tylko w przypadku discrete przewidywalne atrybutów.
Scenariusz
Rozważmy na przykład model, który został utworzony w ramach Podstawowe wyszukiwanie danych — samouczek. The TM_DecisionTree model, which is used to help create a targeted mailing campaign, can be used to predict which customers are most likely to buy a bike.Jeśli klient jest prawdopodobne, kupić rowerów, wartość [Bike Buyer] Kolumna jest 1; Jeśli odbiorca jest mało prawdopodobne, aby kupić rowerów, wartość [Bike Buyer] kolumna ma wartość 0.
Aby ocenić, czy model jest skuteczna na tworzenie prognoz, należy go przetestować zestaw danych dla których wartości [Bike Buyer] już są znane. Zazwyczaj korzystają testowania zestaw danych, który zostanie przeznaczone podczas tworzenia struktura wyszukiwania, która jest używana do szkolenia w modelu.Ponieważ te dane znajdują się już rzeczywiste wyniki, można szybko ustalić liczbę wystąpień modelu przewidywane oczekiwaną wartością.
Opis macierzy klasyfikacji
W poniższej tabela przedstawiono wyniki podczas tworzenia modelu TM_DecisionTree macierzy klasyfikacji.Ze względu na to, że dostępne są tylko dwa możliwe wartości dla tego atrybut przewidywalny, 0 i 1, jest stosunkowo łatwo stwierdzić, jak często modelu powoduje poprawnie przewidywanie.
Przewidywane |
0 (Aktualne) |
1 (Aktualne) |
---|---|---|
0 |
362 |
144 |
1 |
121 |
373 |
Pierwszej komórka wynik zawiera wartość 362, wskazuje liczbę wartość true pozytywne do wartości 0.Ponieważ 0 oznacza, że odbiorcy nie został zakupiony rowerów, w widoku informacji statystycznych, pozwalają określić prawidłową wartość dla innych kupujących rowerów w przypadkach 362 przewidywane tego modelu.
komórka bezpośrednio pod nim że jeden, który zawiera wartość 121, pozwalają liczby fałszywie lub ile razy modelu przewidzieć, że czy ktoś kupić rowerów, gdy faktycznie samo nie.
Komórka zawierająca wartość 144 wskazuje liczbę fałszywie do wartości 1.Ponieważ 1 oznacza, że klient został zakupiony rowerów, w widoku informacji statystycznych, informuje, że w wypadku 144 modelu przewidywane, ktoś mógłby nie kupują rowerów, gdy w rzeczywistości została.
Na końcu komórka zawierającej wartość 373 wskazuje liczbę pozytywne wartość true dla miejsce docelowe wartości 1.Innymi słowy w przypadkach 373 modelu poprawnie przewidywane czy ktoś kupić rowerów.
Sumowanie wartości w komórkach, które po przekątnej sąsiadujących ze sobą, można określić dokładność ogólnej modelu.Ukośny w jednym wskazuje całkowitą liczbę dokładnego przewidywania, a inne ukośnie wskazuje całkowitą liczbę błędnych prognoz.
Korzystanie z wielu wartości uzyskania przewidywalnej
przypadek [Bike Buyer] jest szczególnie łatwe do interpretacji ze względu na to, że dostępne są tylko dwa możliwe wartości.Atrybut przewidywalne ma kilka możliwych wartości, macierzy klasyfikacji doda nową kolumna, dla każdej możliwych wartości rzeczywiste i oblicza, ile dopasowania dla każdej przewidywane wartości.W poniższej tabela przedstawiono wyniki na inny model, gdzie możliwe są trzy wartości (0, 1, 2).
Przewidywane |
0 (Aktualne) |
1 (Aktualne) |
2 (Aktualne) |
---|---|---|---|
0 |
111 |
3 |
5 |
1 |
2 |
123 |
17 |
2 |
19 |
0 |
20 |
Chociaż dodanie większej liczby kolumn powoduje, że w raporcie wyglądały bardziej złożone, dodatkowych szczegółów są przydatne, gdy chcesz ocenić koszt dokonywania niewłaściwy przewidywanie.Aby utworzyć sumy na przekątnych lub do porównywania wyniki dla różnych kombinacji wierszy, można kliknąć Kopia przycisku w Klasyfikacja macierzy kartę i wklej raport do programu Excel.Można także użyć klienta, takie jak wyszukiwanie danych klient dla programu Excel, która obsługuje zarówno SQL Server 2005 i SQL Server 2008, aby utworzyć raport klasyfikacji bezpośrednio w programie Excel, który zawiera zarówno liczby, jak i wartości procentowe. Aby uzyskać więcej informacji zobacz Wyszukiwanie danych serwera SQL.
Tworzenie matrycy klasyfikacji
Po utworzeniu macierzy klasyfikacji, należy wykonać następujące podstawowe kroki:
W Wykres dokładność wyszukiwania Projektant wyszukiwanie danych, kliknij przycisk Wybór wejścia tab.
W Wybór wejścia karcie Wybierz model do oceny.
Umożliwia określenie atrybut przewidywalny i, opcjonalnie, wartość przewidywalne.
Wybierz zestaw danych do użycia w ocenie.
Kliknij przycisk Klasyfikacja macierzy kartę, aby automatycznie wygenerować raport w formacie macierzy klasyfikacji.
Aby procedura krok po kroku, które ma obowiązywać dla wszystkich typów wykresów zobacz Jak Utworzyć wykres dokładność dla model wyszukiwania.
The Basic wyszukiwanie danych Tutorial also includes a walkthrough of how to create a wykres wzrostu for the Targeted Mailing model.Aby uzyskać więcej informacji zobaczTestowanie dokładność z wykresów winda (podstawowe wyszukiwanie danych samouczek).
See Also