Informacje techniczne algorytm serii czasowych firmy Microsoft
The Microsoft czas Series algorithm includes two separate algorithms:
Algorytmu ARTXP, który został wprowadzony w SQL Server 2005, jest zoptymalizowana ze względu na przewidywaniu następnej prawdopodobnie wartości w serii.
Algorytm ARIMA został dodany SQL Server 2008 Aby zwiększyć dokładność w długoterminowych przewidywanie.
Domyślnie Analysis Services za pomocą algorytmu każdy osobno na szkolić w modelu, a następnie łączy wyniki do dają najlepsze przewidywanie dla zmiennej liczby prognoz. Można także użyć tylko jednego z algorytmów, na podstawie własnych danych i przewidywanie wymagań.W SQL Server 2008 Enterprise, można także dostosować Punkt odcięcia, który kontroluje mieszania algorytmy podczas przewidywanie.
Ten temat zawiera dodatkowe informacje na temat sposobu implementacji każdy algorytm i dostosować algorytm przez ustawienie parametrów w celu dostosowania do analizy i przewidywanie wyników.
Implementacja algorytmów seria czas
Microsoft Badania opracowane algorytm ARTXP i na jej podstawie Microsoft Algorytm drzewa decyzji, czyli model drzewa autoregressive odpowiadające okresowe czas serii danych. Algorytm ARTXP odnosi się zmienna liczba poprzednich elementów dla każdego bieżącego zapasu, który jest jest przewidywane.Imię i nazwisko, ARTXP, wynika z fakt algorytm ART lub metoda drzewa autoregressive, zastosowana do wielu, nieznany stanów wcześniejsze.Aby szczegółowy opis algorytmu ARTXP zobacz Modele Autoregressive drzewa na moduł analiz czas serii.
Algorytm ARIMA służy do przewidywanie długoterminowe.Jest to implementacja algorytmu ARIMA opracowane przez pole i Jenkins.ARIMA lub średnią ruchomą autoregressive zintegrowanych, jest dobrze znanych metoda określania zależności w obserwacje dokonane sekwencyjnie w czas.Obsługuje ona również multiplikatywne sezonowością.Algorytm ARIMA używa autoregressive i przenoszenie terminów średnia.
Mimo że algorytm ARTXP obsługuje wzajemne przewidywanie, nie obsługuje algorytmu ARIMA.Dlatego przewidywanie krzyżyk jest dostępny tylko wtedy, gdy jest używany mieszany algorytmów lub podczas konfigurowania modelu w celu wykorzystania tylko ARTXP.
Dostosowywanie Microsoft czas serii algorytm
The Microsoft czas Series algorithm supports several parameters that affect the behavior, performance, and accuracy of the resulting model wyszukiwania.
Wykrywanie sezonowością
Both algorithms support detection of seasonality or periodicity.Analysis Services uses Fast Fourier transformation to detect seasonality before training.
Aby osiągnąć jak najlepsze wyniki, można kontrolować sezonowością wykrywania przez ustawienie parametrów algorytmu.Zmieniając wartość AUTODETECT_SEASONALITY, liczba możliwych może mieć wpływ czas segmenty, które są generowane. Przez ustawienie wartości lub wiele wartości dla PERIODICITY_HINT, można dostarczać informacje o znanych okresy powtarzające się algorytm i zwiększyć dokładność wykrywania.
Uwaga
Algorytmy ARTXP i ARIMA jest wielkość liter do sezonowością wskazówek.W związku z tym zapewniając niewłaściwy wskazówkę dotyczącą może niekorzystnie wpłynąć na wyniki.
Mieszanie algorytmy
Domyślnie Analysis Services łączy i jednakowo przeprowadzi algorytmów. Jednak w SQL Server 2008 Enterprise, można dostosować mieszania wyników przez wybranie opcji mieszane i ustawienie parametru przeprowadzi wyniki kierunku krótkim lub długoterminowe przewidywanie.
Jeśli chcesz użyć krzyżyk przewidywanie, należy użyć ARTXP lub mieszane opcji ponieważ ARIMA nie obsługuje przewidywanie granic.
Aby kontrolować wybór algorytmu, który zestaw FORECAST_METHOD parametr. Domyślnie FORECAST_METHOD parametr jest zestaw do mieszane, a Analysis Services używa Oba algorytmy, a następnie przeprowadzi ich wartości, aby zmaksymalizować mocnych każdego algorytmu. Można jednak zestaw FORECAST_METHOD Aby ARTXP, jeśli chcesz używać jedynie algorytmu ARTXP lub ARIMA, jeśli chcesz używać jedynie algorytmu ARIMA.
W SQL Server 2008 Enterprise, można także dostosować sposób Analysis Services miesza kombinacji algorytmów ARIMA i ARTXP. Oba punktu początkowego mieszanki i szybkość zmian można kontrolować, ustawiając PREDICTION_SMOOTHING parametr:
Jeśli użytkownik zestaw PREDICTION_SMOOTHING 0 model staje się ARTXP czysty.
Jeśli użytkownik zestaw PREDICTION_SMOOTHING 1 model staje się ARIMA czysty.
Jeśli użytkownik set PREDICTION_SMOOTHING wartość od 0 do 1 model przeprowadzi algorytm ARTXP jako funkcja wykładniczo zmniejszającej kroków przewidywanie. W tym samym czas, model również przeprowadzi algorytm ARIMA jako uzupełnienie 1 ARTXP wagi.Model używa normalizacji i stała stabilizacji na gładkie krzywe.
Ogólnie rzecz biorąc Jeśli przewidywania wycinki czas do 5, ARTXP jest prawie zawsze lepszym rozwiązaniem.Niemniej jednak jak możesz zwiększyć liczbę wycinków czas do przewidywania, ARIMA zazwyczaj wykonuje lepiej.
Na poniższym diagramie przedstawiono, w jaki sposób model przejścia algorytmów po PREDICTION_SMOOTHING jest zestaw domyślną wartość 0,5. ARIMA i ARTXP są liczone równomiernie na początku, ale jest numerem przewidywanie kroki wzrasta, ARIMA jest znacznie bardziej ważone.
Natomiast poniższy rysunek stanowi ilustrację mieszania algorytmów po PREDICTION_SMOOTHING ma wartość 0,2. W kroku 0, model przeprowadzi ARIMA 0,2 i ARTXP jako 0,8. Po tej dacie wagi ARIMA wykładniczo zwiększa i waga ARTXP wykładniczo zmniejsza.
Ustawianie parametrów algorytmu
W poniższej tabela opisano parametry, które mogą być używane z Microsoft Algorytm seria czas.
Parameter |
Description |
---|---|
AUTO_DETECT_PERIODICITY |
Określa wartość liczbową między 0 do 1, które wykrywa okresowości. Wartość domyślna to 0,6. Jeśli wartość jest bliżej 0, okresowości jest wykrywany tylko dla danych zdecydowanie okresowych. Ustawienie tej wartości bliżej 1 preferuje odnajdowanie wielu wzorców, które są prawie okresowe i automatyczne generowanie okresowości wskazówek.
Note:
Zajmowanie wielu wskazówek okresowości prawdopodobnie będą prowadziły do znacznie dłuższy czas szkolenia modelu, ale dokładniej modeli.
|
COMPLEXITY_PENALTY |
Określa przyrost drzewo decyzyjne.Wartość domyślna to 0,1. Zmniejszenie tej wartości wzrasta ryzyko podziału.Zwiększenie tej wartości zmniejsza ryzyko podziału.
Note:
Ten parametr jest dostępny tylko w SQL Server Flaga.
|
FORECAST_METHOD |
Określa, który algorytm ma być używany do analizy i prognozowania.Możliwe wartości to ARTXP, ARIMA lub mieszane.Wartością domyślną jest mieszane. |
HISTORIC_MODEL_COUNT |
Określa liczbę modeli historycznych, które zostanie zbudowana.Wartość domyślna to 1.
Note:
Ten parametr jest dostępny tylko w SQL Server Flaga.
|
HISTORICAL_MODEL_GAP |
Określa zwłokę czasową między dwoma modelami historycznych następujących po sobie.Wartość domyślna to 10.Wartość oznacza liczbę jednostek czas, w których jednostka jest zdefiniowane przez model. Na przykład ustawienie tej wartości g powoduje, że historycznych modele mają zostać zbudowane dla danych, który jest obcięty przez czas wycinki odstępach g, 2 * g, 3 * gi tak dalej.
Note:
Ten parametr jest dostępny tylko w SQL Server Flaga.
|
INSTABILITY_SENSITIVITY |
Określa punkt, w którym przewidywanie odchylenie przekracza określony próg i algorytm ARTXP pomija prognoz.Wartość domyślna to 1.
Note:
Ten parametr dotyczy tylko ARTXP i dlatego nie ma zastosowania do modeli, które są tworzone przy użyciu tylko algorytm ARIMA.W wypadku zastosowania modelu mieszane, parametr ma zastosowanie tylko do części ARTXP modelu.
The default value of 1 provides the same behavior for ARTXP models as in SQL Server 2005.Analysis Services monitors the normalized standard deviation for each prediction.Jak najszybciej odchyleń standardize dla wszelkich przewidywanie przekracza próg, algorytm serii czas zwraca wartość NULL i zatrzymuje proces przewidywanie. Wartość 0 Zatrzymuje niestabilność wykrywania. Oznacza to, że można utworzyć nieskończoną liczbę prognoz, niezależnie od odchylenie.
Note:
Ten parametr można modyfikować tylko w SQL Server Flaga. W SQL Server Standard, Analysis Services używa tylko domyślną wartość 1.
|
MAXIMUM_SERIES_VALUE |
Określa maksymalną wartość dla prognoz.Ten parametr jest używany, wraz z MINIMUM_SERIES_VALUE, aby ograniczyć prognoz do niektórych oczekiwano zakres. Na przykład można określić, że przewidywane ilości sprzedaży dla każdego dnia nigdy nie powinna przekraczać liczby produktów w magazynie.
Note:
Ten parametr jest dostępny tylko w SQL Server Flaga.
|
MINIMUM_SERIES_VALUE |
Określa minimalną wartość można przewidzieć.Ten parametr jest używany, wraz z MAXIMUM_SERIES_VALUE, aby ograniczyć prognoz do niektórych oczekiwano zakres. Na przykład można określić, że przewidywane ilości sprzedaży nigdy nie powinna być liczbą ujemną.
Note:
Ten parametr jest dostępny tylko w SQL Server Flaga.
|
MINIMUM_SUPPORT |
Określa minimalną liczbę wycinków czas wymaganych do generowania podział w drzewie serii każdej godziny.Wartość domyślna to 10. |
MISSING_VALUE_SUBSTITUTION |
Określa, w jaki sposób są wpisywane przerw w danych historycznych.Domyślnie przerwy w danych nie są dozwolone. W poniższej tabela przedstawiono możliwe wartości tego parametru:
WartośćDescription
PreviousPowtarza się wartości z poprzedniego przedział czas.
MeanUżywa średniej ruchomej wycinków czas w szkolenia.
stała liczbowejUżywa określonej liczby w celu zastąpienia wszystkich brakujących wartości.
NoneZastępuje brakujące wartości z wartościami są wykreślane wzdłuż krzywej wyszkolonych modelu.Jest to wartość domyślna.
Jeśli dane zawierają wiele serii danych, serii nie może mieć ragged krawędzie.Oznacza to wszystkie serie powinny mieć takie same rozpoczęcia i punktów końcowych. Analysis Services Aby wypełnić przerwy w nowych danych, podczas wykonywania używa również wartość tego parametru PREDICTION JOIN na czas modelu serii. |
PERIODICITY_HINT |
Zawiera wskazówki w algorytmie, aby okresowości danych.Na przykład jeśli sprzedaży zależy od roku, a jednostki miary w serii są miesiące, okresowość wynosi 12.Ten parametr ma format {n [, n]}, where n jest dowolną liczbą dodatnią. The n in the brackets [] is optional and can be repeated as frequently as needed.Na przykład aby udostępnia kilka wskazówek okresowość dla dostarczonych danych co miesiąc, możesz wpisać {12, 3, 1} do wykrywać wzorów rok, kwartał i miesiąc.Okresowość ma jednak silny wpływ na jakość modelu.Jeśli wskazówki, którzy zetknęli różni się od rzeczywistej okresowości, wyniki wyszukiwania mogą mieć negatywny wpływ. Wartość domyślna to {1}.
Note:
Wymagane są nawiasy klamrowe.Ponadto ten parametr ma typ danych ciąg znaków.W związku z tym jeśli ten parametr zostanie wpisana jako część instrukcja DMX (wyszukiwanie danych rozszerzenia), należy ująć numer i nawiasy w cudzysłowach.
|
PREDICTION_SMOOTHING |
Określa, jak modelu powinny być łączone w celu zoptymalizowania prognozowania.Można wpisać dowolną wartość z przedziału 0 1 i lub użyj jednej z następujących wartości:
Note:
Użycie FORECAST_METHOD parametru do formantu szkolenia.
WartośćDescription
0Określa, że przewidywanie używa tylko ARTXP.Prognozowanie jest zoptymalizowany pod kątem mniej prognoz.
1Określa, że przewidywanie używa tylko ARIMA.Prognozowanie jest zoptymalizowany pod kątem wielu prognoz.
0.5(Domyślnie) Określa, w przypadku przewidywanie Oba algorytmy, należy użyć, a wyniki mieszane.
Note:
Ten parametr jest dostępny tylko w SQL Server Flaga.
|
Modelowanie flagi
The Microsoft czas Series algorithm supports the following modeling flags. Podczas tworzenia struktura wyszukiwania lub model wyszukiwania, należy zdefiniować modelowania flagi, aby określić sposób obsługi wartości w każdej kolumnie podczas analizy.Aby uzyskać więcej informacji zobaczFlagi modelowania (wyszukiwanie danych).
Flaga modelowania |
Description |
---|---|
NIEDOZWOLONE WARTOŚCI NULL |
Wskazuje, że kolumna nie może zawierać wartość null.Jeżeli usługi Analysis Services napotyka wartość null podczas szkolenia modelu, spowoduje błąd. Stosuje się do kolumn struktura wyszukiwania. |
MODEL_EXISTENCE_ONLY |
Oznacza, że kolumna będą traktowane jako mające dwóch możliwych stanów: Brak i istniejącego. Wartość null jest brak wartości. Stosuje się do kolumn w model wyszukiwania. |
Wymagania
Czas modelu serii musi zawierać kolumnę klucz czasu, która zawiera unikatowych wartości, wejściowy kolumny i co najmniej jedną przewidywalna kolumna.
Dane wejściowe i uzyskania przewidywalnej kolumny
The Microsoft czas Series algorithm supports the specific input column content types, przewidywalna kolumna content types, and modeling flags that are listed in the following tabela.
Kolumna |
Typy zawartości |
---|---|
Atrybut wejściowy |
Ciągłe, klucza, klucz czas i tabela |
Atrybut przewidywalne |
Ciągłe, tabela |
Uwaga
Obsługiwane są typy zawartości Cyclical i Zamówione, ale algorytm traktuje je jako discrete wartości i nie wykonuje przetwarzania specjalne.