Занятие 4: Создание прогнозов временных рядов, с помощью расширений интеллектуального анализа данных
Применимо к: SQL Server 2016 Preview
На этом и следующем уроке, расширений интеллектуального анализа данных (DMX) будет использовать для создания различных типов прогнозов, основанных на модели временных рядов, которые созданы в занятия 1: Создание структуры интеллектуального анализа данных и модели интеллектуального анализа данных временных рядов и Урок 2: Добавление модели интеллектуального анализа данных для структуры интеллектуального анализа данных временных рядов.
Использование модели временных рядов дает много возможностей для выполнения прогнозирования.
Использование в модели интеллектуального анализа данных существующих закономерностей и данных.
Использование в модели интеллектуального анализа данных существующих закономерностей, но предоставление новых данных.
Добавление в модель новых данных или обновление модели.
Далее приведен синтаксис выполнения этих типов прогнозов.
Используемый по умолчанию прогноз временных рядов.
Используйте PredictTimeSeries ( расширений интеллектуального анализа данных ) для возврата указанное число прогнозов из обученной модели.
Например, в разделе PredictTimeSeries ( расширений интеллектуального анализа данных ) или Примеры запросов к модели ряда времени.
EXTEND_MODEL_CASES
Используйте PredictTimeSeries ( расширений интеллектуального анализа данных ) с аргументом EXTEND_MODEL_CASES позволяет добавлять новые данные, расширять ряды и создавать прогнозы на основании модели интеллектуального анализа данных обновленный.
Этот учебник содержит пример использования аргумента EXTEND_MODEL_CASES.
REPLACE_MODEL_CASES
Используйте PredictTimeSeries ( расширений интеллектуального анализа данных ) с аргументом REPLACE_MODEL_CASES, чтобы заменить исходные данные новыми рядами данных, а затем создать прогнозов, основанных на применении закономерностей в модели интеллектуального анализа данных для нового ряда данных.
Пример использования аргумента REPLACE_MODEL_CASES см. в разделе Урок 2: построение сценария прогнозирования ( Intermediate Data Mining Tutorial ).
Задачи занятия
На этом занятии будут выполнены следующие задачи.
- Создание запроса для получения используемых по умолчанию прогнозов, основанных на существующих данных.
На следующем занятии будут выполнены следующие связанные задачи.
- Создание запроса для предоставления новых данных и получения обновленных прогнозов.
Наряду с созданием запросов вручную, при помощи расширений интеллектуального анализа данных, можно также создавать прогнозы в среде SQL Server Data Tools (SSDT), с помощью построителя прогнозирующих запросов.
Простой прогнозирующий запрос временных рядов
Первым шагом является использование SELECT FROM инструкции вместе с PredictTimeSeries функцию для создания прогнозов временных рядов. Модели временных рядов поддерживают упрощенный синтаксис создания прогнозов: нет необходимости предоставлять входные данные, нужно только задать количество создаваемых прогнозов. В следующем фрагменте показан общий пример инструкции, которая будет использоваться в дальнейшем.
SELECT <select list>
FROM [<mining model name>]
WHERE [<criteria>]
Список выбора может содержать столбцы из модели, такие как имя продукта, строки, вы создаете прогнозы, или прогнозирующие функции, такие как запаздывания ( расширений интеллектуального анализа данных ) или PredictTimeSeries ( расширений интеллектуального анализа данных ), специально предназначенные для модели интеллектуального анализа данных временных рядов.
Создание простого запроса прогнозирования временного ряда
В обозревателя объектов, щелкните правой кнопкой мыши экземпляр Службы Analysis Services, пункты новый запрос, а затем нажмите кнопку расширений интеллектуального анализа данных.
Откроется редактор запросов, содержащий новый, пустой запрос.
Скопируйте общий пример инструкции в пустой запрос.
Вместо
<select list>
вставьте
[Forecasting_MIXED].[ModelRegion], PredictTimeSeries([Forecasting_MIXED].[Quantity],6) AS PredictQty, PredictTimeSeries ([Forecasting_MIXED].[Amount],6) AS PredictAmt
В первой строке извлекается значение из модели интеллектуального анализа данных, которая идентифицирует ряд.
Второй и третьей линий используется PredictTimeSeries функции. В каждой строке предсказание выполняется для разных атрибутов, для
[Quantity]
или[Amount]
. Числа после имен прогнозируемых атрибутов указывают количество временных шагов, необходимых для прогнозирования.AS предложение используется для задания имени столбца, возвращаемого каждой прогнозирующей функции. Если псевдоним не указывается, по умолчанию возвращаются оба столбца с меткой
Expression
.Вместо
[<mining model>]
вставьте
[Forecasting_MIXED]
Вместо
WHERE [criteria>]
вставьте
WHERE [ModelRegion] = 'M200 Europe' OR [ModelRegion] = 'M200 Pacific'
Полная инструкция теперь должна выглядеть следующим образом.
SELECT [Forecasting_MIXED].[ModelRegion], PredictTimeSeries([Forecasting_MIXED].[Quantity],6) AS PredictQty, PredictTimeSeries ([Forecasting_MIXED].[Amount],6) AS PredictAmt FROM [Forecasting_MIXED] WHERE [ModelRegion] = 'M200 Europe' OR [ModelRegion] = 'M200 Pacific'
В меню Файл щелкните Сохранить DMXQuery1.dmx как.
В Сохранить как диалоговом перейдите к соответствующей папке и присвойте файлу имя SimpleTimeSeriesPrediction.dmx.
На панели инструментов нажмите кнопку Выполнить .
Запрос возвращает 6 прогнозов для каждого из двух сочетаний продукта и региона, указанных в ГДЕ предложения.
На следующем занятии будет создан запрос, предоставляющий модели новые данные, и будет выполнено сравнение результатов этого прогноза с результатами только что созданного прогноза.
Следующая задача занятия
Занятие 5. Расширение модели временных рядов
См. также:
PredictTimeSeries (расширения интеллектуального анализа данных)
Lag (расширения интеллектуального анализа данных)
Примеры запросов моделей временных рядов
Занятие 2: Построение сценария прогнозирования ( учебник по интеллектуальному анализу данных — средний )