Настройка и обработка модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)
Применимо к: SQL Server 2016 Preview
Алгоритм временных рядов (Microsoft) предоставляет параметры, которые влияют на способ создания модели и методы анализа временных данных. С помощью этих свойств можно существенно повлиять на прогнозы, сделанные моделью интеллектуального анализа данных.
На этом занятии учебника вы выполните следующие изменения модели.
Будет настроить способ обработки модели временных рядов путем добавления нового значения для PERIODICITY_HINT параметр.
Вы узнаете о двух других важных параметрах алгоритма временных рядов: FORECAST_METHOD, который позволяет управлять методом прогнозирования, и PREDICTION_SMOOTHING, который позволяет задать сочетание долгосрочных и краткосрочных прогнозов.
При необходимости можно указать алгоритму, как вычислять отсутствующие значения.
После внесения всех изменений необходимо будет развернуть и обработать модель.
Настройка параметров временных рядов
Указания периодичности
PERIODICITY_HINT параметр дает алгоритму сведения о дополнительных временных периодах, которые вы хотите увидеть в данных. По умолчанию модели временных рядов автоматически пытаются обнаружить закономерность в данных. Но если ожидаемый временной цикл уже известен, указание периодичности может повысить точность модели. Однако неправильное указание периодичности может снизить точность, поэтому если вы не уверены, какое значение использовать, лучше оставить значение по умолчанию.
Например, представление для этой модели суммирует данные продаж из Adventure Works DW Multidimensional 2012 по месяцам. Поэтому каждый временной срез, используемый моделью, представляет один месяц, и все прогнозы также делаются по месяцам. Поскольку существуют в году 12 месяцев и предполагается, что картина продаж более или менее повторяется ежегодно, необходимо задать PERIODICITY_HINT параметра 12, чтобы указать, что 12 временных срезов (месяцев) составляют один полный цикл продаж.
Метод прогнозирования
FORECAST_METHOD параметр контролирует, оптимизирована ли алгоритм временных рядов для краткосрочных или долгосрочных прогнозов. По умолчанию FORECAST_METHOD имеет значение MIXED. Это означает, что два разных алгоритма объединены и сбалансированы для получения хороших результатов для краткосрочных и долгосрочных прогнозов.
Однако если вы хотите использовать определенный алгоритм, можно изменить это значение на ARIMA или ARTXP.
Баланс между долгосрочными и краткосрочными прогнозами
Можно также настроить сочетание долгосрочных и краткосрочных прогнозов с помощью параметра PREDICTION_SMOOTHING. По умолчанию он имеет параметр 0,5, что обычно обеспечивает наилучший баланс для общей точности.
Изменение параметров алгоритма
На модели интеллектуального анализа данных щелкните правой кнопкой мыши Forecasting, и выберите задать параметры алгоритма.
В PERIODICITY_HINT строки Параметры алгоритма диалоговом нажмите кнопку значение столбец, затем введите {12}, включая фигурные скобки.
По умолчанию алгоритм также добавит значение {1}.
В FORECAST_METHOD строк, убедитесь, что значение текстовое поле пусто или содержит значение для MIXED. Если другое значение введено, введите MIXED Чтобы изменить параметр по умолчанию.
В PREDICTION_SMOOTHING строк, убедитесь, что значение текстовое поле пусто или равно 0,5. Если другое значение введено, щелкните значение и тип 0,5 Чтобы изменить параметр по умолчанию.
Примечание
Параметр PREDICTION_SMOOTHING доступен только в версии SQL Server Enterprise. Поэтому увидеть или изменить значение параметра PREDICTION_SMOOTHING в выпуске SQL Server Standard нельзя. Однако по умолчанию используются оба алгоритма с одинаковым весом.Нажмите кнопку ОК.
Обработка отсутствующих данных (необязательно)
Во многих случаях данные продаж могут иметь пробелы, заполненные нулями, или магазин может не выполнить отчет к сроку, в результате чего в конце ряда останется пустая ячейка. В таких случаях службы Службы Analysis Services не будут обрабатывать модель и выдадут следующую ошибку.
«Ошибка (интеллектуальный анализ данных): временные метки не синхронизированы начиная с последовательностей , модели интеллектуального анализа данных . Все временные ряды должны завершаться в одной временной метке и не могут иметь произвольно отсутствующие точки данных. Задание в качестве значения параметра MISSING_VALUE_SUBSTITUTION "PREVIOUS" или числовой константы автоматически исправляет отсутствующие точки данных, где это возможно».
Чтобы избежать этой ошибки, можно указать, что службы Службы Analysis Services должны автоматически предоставлять новые значения для заполнения промежутков с помощью одного из следующих методов.
Использование среднего значения. Среднее значение вычисляется с помощью всех действительных значений в одном ряде данных.
Использование предыдущего значения. Несколько ячеек с отсутствующими данными можно заполнить предыдущими значениями, но нельзя заполнить начальные значения.
Использование предоставляемого постоянного значения.
Заполнение промежутков средними значениями
На модели интеллектуального анализа данных щелкните правой кнопкой мыши Forecasting столбец, а затем выберите задать параметры алгоритма.
В Параметры алгоритма диалогового MISSING_VALUE_SUBSTITUTION щелкните значение столбца и тип означает.
Построение модели
Чтобы использовать модель, необходимо развернуть ее на сервере и обработать, выполнив алгоритм с обучающими данными.
Обработка модели прогнозирования
На модель интеллектуального анализа данных меню SQL Server Data Tools, выберите обработать структуру интеллектуального анализа данных и все модели.
В окне предупреждения с вопросом о том, нужно ли выполнить построение и развертывание проекта, нажмите кнопку Да.
В Обработка структуры интеллектуального анализа данных — Прогнозирование диалоговом нажмите кнопку запуска.
Будет открыто диалоговое окно Ход обработки , в котором отображаются сведения о ходе обработки модели. Обработка модели может занять некоторое время.
После успешного завершения обработки нажмите кнопку Закрыть , чтобы закрыть диалоговое окно Ход обработки .
Щелкните Закрыть еще раз, чтобы выйти из Обработка структуры интеллектуального анализа данных — Прогнозирование диалоговое окно.
Следующая задача занятия
Изучение модели прогнозирования ( учебник по интеллектуальному анализу данных — средний )
См. также:
Технический справочник по алгоритму временных рядов (Майкрософт)
Алгоритм временных рядов (Майкрософт)
Требования к обработке и связанные замечания (интеллектуальный анализ данных)