Microsoft Time Series Algorithm
The Microsoft czas Series algorithm provides regresja algorithms that are optimized for the forecasting of continuous values, such as product sales, over czas. Podczas gdy inne Microsoft algorytmy, takie jak drzewa decyzji, wymagają dodatkowych kolumn nowych informacji jako dane wejściowe do przewidywania tendencji, czas, nie obsługuje model serii. Czas modelu serii można przewidzieć, trendy dotyczące tylko oryginalnego zestawu danych, który jest używany do tworzenia modelu.Można również dodać nowe dane do modelu po wprowadzeniu przewidywanie i automatycznie dołączyć nowe dane do analizy trend.
Na poniższym diagramie przedstawiono typowy wzór Prognozowanie sprzedaży w czterech różnych regionów sprzedaży produktu za pośrednictwem czas.Model, który jest wyświetlany na diagramie przedstawia sprzedaż dla każdego region wykreślane jako czerwonego, żółty, fioletowe i niebieskie linie.Wiersz dla każdego region składa się z dwóch części:
Informacji o historii pojawia się na lewo od linii pionowej i reprezentuje dane, które algorytm używany do tworzenia modelu.
Przewidywane informacji pojawia się na prawo od linii pionowej i reprezentuje prognozy, który sprawia, że model.
Połączenie danych źródłowych i danych przewidywanie nosi nazwę Seria.
Ważną cechą Microsoft Algorytm seria czas jest, może wykonywać przewidywanie krzyżowego. Jeśli przeprowadzisz szkolenia algorytm z dwóch oddzielnych, ale powiązane, serii, umożliwia wynikowy modelu do przewidywania wyniku jedną serią na podstawie zachowania z drugą serią.Na przykład obserwowanych sprzedaży jednego produktu może mieć wpływ sprzedaży prognozowane innego produktu.przewidywanie krzyżowego jest również przydatne do tworzenia ogólnych modelu, który można zastosować do wielu serii.Na przykład prognoz dla danego region są niestabilny, ponieważ serie brakuje danych dobrej jakości.Użytkownik może szkolić ogólne wzór na średnią wszystkich czterech rejonach, a następnie Zastosuj modelu do poszczególnych serii w celu tworzenia bardziej stabilne prognoz dla każdego region.
Przykład
Zespół zarządzający na Adventure Works Cycles chce prognozować miesięcznej sprzedaży rowerów na nadchodzący rok. Firma jest szczególnie interesujące czy sprzedaży rowerów jednego modelu mogą być używane do przewidywania sprzedaży innego modelu.Za pomocą Microsoft Algorytm seria czas na historycznych danych z ostatnich trzech lat, firma może prowadzić do model wyszukiwanie danych, który prognoz sprzedaży rowerów w przyszłości. Ponadto firma może wykonać krzyżowego prognoz w celu wyświetlenia powiązane trendów sprzedaży rowerów poszczególnych modeli.
Co kwartał, firma planuje zaktualizować model przy użyciu najnowszych danych dotyczących sprzedaży i aktualizowanie ich przewidywania modelować najnowszych trendów.Aby poprawić w sklepach, nie są dokładnie lub stale aktualizować dane dotyczące sprzedaży, będzie utworzyć model prognozowania ogólne i użyć jej do tworzenia prognoz dla wszystkich regionów.
Jak działa algorytmu
W SQL Server 2005, Microsoft Pojedynczy algorytmu, ARTxp używany algorytm serii czas. Algorytm ARTXp został zoptymalizowany pod kątem krótkoterminowych prognoz i dlatego przewidywane następnej prawdopodobnie wartości w serii.W SQL Server 2008, Microsoft Algorytm seria czas używa algorytmu ARTxp i drugiego algorytmu, ARIMA. Algorytm ARIMA jest zoptymalizowany do przewidywanie długoterminowe.Aby szczegółowe informacje o implementacji algorytmów ARTxp i ARIMA zobacz Informacje techniczne algorytm serii czasowych firmy Microsoft.
Domyślnie Microsoft Algorytm seria czas używa różnych algorytmów analizuje ono desenie i wprowadzania prognoz. Algorytm przygotowuje dwóch osobnych modeli na tych samych danych: jeden model używa algorytmu ARTxp i jeden model używa algorytmu ARIMA. Algorytm mieszania następnie wyniki dwóch modeli, aby dawała najlepsze przewidywanie zmiennej liczbie wycinki czas.Ponieważ ARTxp nadaje się najlepiej do przewidywania krótkoterminowych, jest on ważone więcej silnie na początku serii prognoz.Jednak w momencie plasterki, które można są przewidywaniu przenoszenie dalszych w przyszłości, ARIMA jest ważoną więcej silnie.
Można również kontrolować różnych algorytmów do preferować albo krótko- i długoterminowych przewidywanie w godziny serii.W SQL Server 2008 Standardowe, można określić, Microsoft Algorytm seria czas należy zastosować jedną z następujących ustawień:
Użyj tylko ARTxp krótkoterminowe przewidywanie.
Użyj tylko ARIMA przewidywanie długoterminowe.
Użyj domyślnego mieszania dwóch algorytmów.
W SQL Server 2008 Enterprise, można dostosować sposób Microsoft Algorytm seria czas przejścia modele do przewidywanie. Korzystając z modelu mieszane, Microsoft Algorytm seria czas miesza dwa algorytmy w następujący sposób:
Tylko ARTxp jest zawsze używany do tworzenia pierwsze kilka prognoz.
Po pierwsze kilka prognoz używana jest kombinacja ARIMA i ARTxp.
Jak wzrasta liczba kroków przewidywanie, prognoz więcej silnie polegać na ARIMA, dopóki ARTxp nie jest już używany.
Można określić punktu mieszania, szybkość, z jaką wagę ARTxp jest zmniejszyła się i waga ARIMA zwiększa się przez ustawienie parametru PREDICTION_SMOOTHING.
Oba algorytmy, można wykrywać sezonowością danych na wielu poziomach.Na przykład dane mogą zawierać miesięcznych cykli zagnieżdżone w cyklu rocznym.Aby wykryć te sezonowych cykli, można zapewnić Wskazówka okresowości lub określić algorytm powinien automatycznie wykryć okresowości.
Oprócz okresowości, istnieje kilka innych parametrów, które kontrolują zachowanie Microsoft Algorytm seria czas po wykryciu okresowości, sprawia, że prognoz lub analizuje przypadkach. Aby uzyskać informacje dotyczące ustawiania parametrów algorytmu, zobacz Informacje techniczne algorytm serii czasowych firmy Microsoft.
Wymagane do czas modele serii danych
Przygotowywanie danych do użycia w szkolenia żadnych danych model wyszukiwania, upewnij się, że poznać wymagania dotyczące określonego modelu i sposobu używania danych.
Każdy prognozowania, model musi zawierać przypadek serii danych, czyli kolumna, która określa czas wycinki lub innych serii, w którym następuje zmiana.Na przykład danych na diagramie poprzedniego podana jest seria sprzedaży rowerów historyczne i prognozowanych, kilka miesięcy w okresie.Dla tego modelu każdego region to seria, a data, kolumna zawiera czas serii danych, czyli liter serii.W innych modelach przypadek serii może być pole tekstowym lub niektóre identyfikator, taki jak identyfikator klienta lub identyfikator transakcji.Jednak czas modelu serii należy zawsze stosować data, godzinę lub niektóre inne unikatowa wartość liczbowa jego serii przypadek.
Wymagania dotyczące czas modelu serii są następujące:
Kolumna klucz raz Każdy model musi zawierać jedną kolumnę numerycznym lub data, który jest używany jako serii przypadek, która definiuje wycinki czas, który będzie używany w modelu.Typ danych dla kolumna klucz czas może być typu danych Data/Godzina lub typ danych numerycznych.Jednak kolumna muszą zawierać wartości stałe i wartości muszą być unikatowe dla każdej serii.przypadek serii dla modelu serii czas nie mogą być przechowywane w dwóch kolumnach, na przykład kolumna rok i miesiąc kolumny.
przewidywalna kolumna Każdy model musi zawierać co najmniej jedną kolumnę przewidywalny, wokół którego algorytm utworzy modelu czas serii.Typ danych przewidywalna kolumna muszą mieć stałe wartości.Na przykład przewidzieć sposób numeryczna atrybuty, takie jak zmian temperatury, przychód lub sprzedaży, w czas.Jednak nie można używać kolumna, która zawiera wartości discrete, takie jak stan zakupów lub poziom wykształcenia przewidywalne kolumną.
To opcjonalne serii kolumna klucz Każdy model może zawierać dodatkową kolumnę klucz, zawierającym unikatowe wartości identyfikujące serii.Kolumna klucz opcjonalne serii musi zawierać wartości unikatowe.Na przykład pojedynczy model może zawierać sprzedaży dla wielu modeli produktów, dopóki istnieje tylko jeden rekord dla każdej nazwy produktu, dla każdego przedział czas.
Można zdefiniować dane wejściowe dla Microsoft Czas seria model na kilka różnych sposobów. Jednak ponieważ format wejściowy przypadkach wpływa na definicji model wyszukiwania, należy wziąć pod uwagę potrzeb biznesowych i odpowiednio przygotuj dane.Dwa poniższe przykłady ilustrują, w jaki sposób wpływa na dane wejściowe w modelu.W obu przykładach model zakończonego wyszukiwania zawiera desenie dla czterech różnych serii:
Sprzedaż produktów A
Sprzedaży produktu B
Głośność produktu A
Głośność produkt B
W obu przykładach przewidywania nowych przyszłej sprzedaży i wielkości dla każdego produktu.Nie można przewidzieć, nowe wartości dla produktu lub raz.
Przykład 1: Dwie kolumny uzyskania przewidywalnej
W tym przykładzie w poniższej tabela przypadkach wejściowe:
TimeID |
Produkt |
Sprzedaż |
Wolumin |
---|---|---|---|
1/2001 |
A |
1000 |
600 |
2/2001 |
A |
1100 |
500 |
1/2001 |
B |
500 |
900 |
2/2001 |
B |
300 |
890 |
Kolumna TimeID w tabela zawiera identyfikator czas i zawiera dwa wpisy dla każdego dnia.Kolumna TimeID staje się sprawami serii.W związku z tym w tej kolumnie mogą wyznaczyć jako kolumna klucz czas dla modelu czas serii.
Kolumna Produkt definiuje produkt w bazie danych.Ta kolumna zawiera serię produktu.W związku z tym w tej kolumnie mogą wyznaczyć jako drugi klucz dla modelu czas serii.
Zysk brutto określonego produktu zawiera opis kolumna Sprzedaż dla jednego dnia, a także kolumna wolumin opis ilość określonego produktu, który pozostaje w magazynie.Te dwie kolumny zawierają dane używane na szkolić w modelu.
Przykład 2: Cztery kolumny uzyskania przewidywalnej
Mimo że w tym przykładzie użyto zasadzie te same dane wejściowe w pierwszym przykładzie, dane wejściowe składa się inaczej, jak pokazano w poniższej tabela:
TimeID |
A_Sales |
A_Volume |
B_Sales |
B_Volume |
---|---|---|---|---|
1/2001 |
1000 |
600 |
500 |
900 |
2/2001 |
1100 |
500 |
300 |
890 |
W tej tabela kolumna TimeID nadal zawiera przypadek serii dla modelu serii czas, który można wyznaczyć jako kolumna klucz czas.Jednak poprzedniego sprzedaży i woluminów kolumny teraz są podzielone na dwie kolumny, a każdy z tych kolumn są poprzedzone nazwę produktu.W wyniku dla każdego dnia kolumna TimeID istnieje tylko pojedynczego wpisu.Spowoduje to utworzenie modelu serii czas, który zawiera cztery kolumny przewidywalne: A_Sales, A_Volume, B_Sales i B_Volume.
Ponadto ponieważ produkty mają być podzielone na różnych kolumn, nie trzeba określić kolumna klucz dodatkowe serii.Wszystkie kolumny w modelu są kolumny serii przypadek lub przewidywalna kolumna.
Wyświetlanie modelu czas serii
Model ma został wyszkolony, wyniki są przechowywane jako zbiór wzorce, które można eksplorować lub użyć do utworzenia prognoz.
Aby poznać modelu, można użyć Podgląd seria czas.Podgląd zawiera wykres, który wyświetla przewidywania przyszłych i widoku drzewa okresowe struktur danych.
Aby dowiedzieć się więcej na temat sposobu obliczania prognoz, można przeglądać w modelu Podgląd zawartości drzewa rodzajowa firmy Microsoft.Zawartość przechowywaną modelu zawiera szczegóły, takie jak okresowej struktury wykrytych przez algorytmy ARIMA i ARTxp równanie używane do mieszania algorytmów i inne dane statystyczne.
Tworzenie prognoz seria czasu
Domyślnie, podczas przeglądania model serii czas Analysis Services Pokazuje prognoz pięciu serii. Jednak tworzyć kwerendy, aby przywrócić zmienna liczba prognoz i może dodatkowe kolumny do przewidywania należy wyznaczyć Statystyki opisowe.Aby uzyskać informacje dotyczące tworzenia kwerend względem czas modelu serii zobacz Podczas badania modelu czasu serii (Analysis Services — wyszukiwanie danych). Aby zapoznać się z pomocą wyszukiwanie danych rozszerzeń (DMX) czas przewidywania serii przykładami zobacz PredictTimeSeries (DMX).
Podczas korzystania z Microsoft Algorytm seria czas dokonania prognoz, należy wziąć pod uwagę następujące dodatkowe ograniczenia i wymagania:
przewidywanie między jest dostępna tylko podczas korzystania z modelu mieszanych lub oparte na algorytmie ARTxp modelu.Jeżeli program jest używany model oparty tylko na algorytmie ARIMA przewidywanie krzyżyk nie jest możliwe.
Model serii czas może być prognoz, które są różne, czasami znacznie, w zależności od 64-bitowym systemie operacyjnym, używany przez serwer.Różnice te występują zgodnie ze sposobem, w których Itanium-opartych na systemie reprezentuje i obsługuje numerów zmiennoprzecinkowych arytmetyczną, która różni się od sposobu, w których x64-opartych na system wykonuje następujące obliczenia. przewidywanie wyniki mogą być określone w systemie operacyjnym, zaleca się dokonanie oceny modele tego samego systemu operacyjnego, który zostanie użyty w produkcji.
Uwagi
Nie obsługuje używania przewidywanego modelu Markup Language (PMML) do tworzenia modeli wyszukiwania.
Obsługuje korzystanie z modeli wyszukiwania OLAP.
Nie obsługuje tworzenia wymiary wyszukiwanie danych.
Obsługuje przeglądanie szczegółowe.
See Also