Поделиться через


Изучение модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

 

Применимо к: SQL Server 2016 Preview

После создания модели интеллектуального анализа данных прогнозирования, результаты можно изучить с помощью средство просмотра моделей интеллектуального анализа данных конструктора интеллектуального анализа данных. Microsoft Средство просмотра временных рядов содержит две вкладки: диаграммыи модели.

Кроме того, для всех моделей можно использовать средство просмотра деревьев содержимого общего вида (Майкрософт). Каждое представление дает различную картину данных, имеющихся в модели временных рядов.

  • Вкладка «Диаграммы»

  • Вкладка «Модель»

  • Средство просмотра деревьев содержимого общего вида (Майкрософт)

Вкладка «Диаграммы»

Диаграммы вкладке Microsoft средство просмотра временных рядов в графическом виде отображаются все ряды, включая исторических данных и прогнозов. Каждая линия на графике временных рядов представляет уникальное сочетание товара, региона и прогнозируемого атрибута.

В условных обозначениях, расположенных в правой части средства просмотра, перечислены временные ряды, которые доступны в зависимости от параметров, выбранных в раскрывающемся списке. Устанавливая и снимая соответствующие флажки в условных обозначениях, можно управлять отображением временных рядов на графике.

Также можно изменить такие параметры отображения, как цвет каждого временного ряда, или указать, отображаются ли значения при точках диаграммы.

Выбор временных рядов

  1. Щелкните диаграммы вкладке средство просмотра модели интеллектуального анализа вкладку, если оно не отображается.

  2. Установите все флажки в раскрывающемся списке, расположенном справа от представления диаграммы. Нажмите кнопку ОК.

    Теперь на диаграмме должны располагаться 24 различные линии рядов.

  3. Снимите флажки, расположенные справа от диаграммы, чтобы временно скрыть линии всех рядов, основанных на сумме.

    Теперь снимите флажки, связанные с моделями велосипедов R750 и R250.

    В результате этих действий сейчас на диаграмме представлены следующие шесть линий рядов, что позволяет упростить сравнение трендов для моделей велосипедов M200 и T1000.

    • M200 Europe: количество

    • M200 North America: количество

    • M200 Тихоокеанский регион: количество

    • T1000 Europe: количество

    • T1000 Северная Америка: количество

    • T1000 Pacific: количество

Прогнозируемые серии количества M200 и T1000

Диаграмма, отображаемая в этом средстве просмотра, включает как данные с предысторией, так и прогнозируемые данные. Прогнозируемые данные выделены затенением, чтобы они отличались от исторических. Для упрощения сравнения различных рядов можно изменить цвета, соответствующие каждой линии графа. Дополнительные сведения см. в разделе Изменение цветов, используемых в средствах просмотра интеллектуального анализа данных.

Линии трендов показывают, что общий объем продаж по всем регионам в целом растет, при этом пик наступает каждые 12 месяцев в декабре. Анализируя данную диаграмму, можно также сказать, что велосипеды модели T1000 имеют не такой большой объем исторических данных, как другие ряды товаров. Так происходит потому, что это новый товар. Поскольку данный ряд основан на гораздо меньшем объеме данных, прогнозы будут менее точны.

По умолчанию для каждого временного ряда отображается пять этапов прогнозирования в виде пунктирных линий. Количество этапов прогнозирования можно увеличить или уменьшить, изменив это значение. Также можно графически отобразить стандартное отклонение для прогноза путем добавления в диаграмму значений погрешностей.

Изменение параметров прогноза и отображения в представлении диаграммы

  1. Попробуйте изменить значение для этапы прогнозирования последовательно из 5 для 10, а затем обратно 6.

    Если в данных с предысторией имеют место значительные колебания, то эти колебания будут воспроизводиться и даже усиливаться по мере увеличения числа этапов прогнозирования. Здесь следует провести некоторое исследование, чтобы выявить причину резкого увеличения в данных с предысторией, а затем решить, остановиться ли достигнутых результатах, искать способ исправления исходных данных или применить к модели методы сглаживания.

  2. Выберите Отображать отклонения флажок.

    Для каждого прогнозируемого значения будет показываться оценка ошибки.

  3. Обратите внимание на шкалу оси X. Изменения в данных с предысторией и прогнозируемых данных всегда выражаются процентным значением, но фактические данные автоматически подстраиваются так, чтобы разместить на графике все значения. Поэтому следует соблюдать осторожность при сравнении моделей и не полагаться только на наблюдение. Чтобы получить точное значение или процентное увеличение и значение для прогнозов, наведите указатель мыши на пунктирную линию или сплошные линии, или выберите строки, чтобы просмотреть значения в обозначения интеллектуального анализа данных.

    Совет: Если обозначения интеллектуального анализа данных не отображается, перейдите в модели просмотра, щелкните правой кнопкой мыши любой узел и выберите Показать условные обозначения.

Тренды продемонстрировали недостаток данных для некоторых рядов. Возможно, усреднение продаж по модели или по региону позволит получить более достоверные прогнозы. Такой подход рассматривается далее в этом учебнике.

В начало

Вкладка «Модель»

Модели вкладке Microsoft средство просмотра временных рядов в конструкторе интеллектуального анализа данных позволяет просматривать модель прогнозирования в виде диаграммы дерева принятия решений.

Поскольку в данных описаны две различные меры (Amount и Quantity) для продаж нескольких серий товара (T1000 и т. д.) в трех различных регионах (Europe, North America и Pacific), то построенная модель фактически содержит 24 различных дерева, каждое из которых представляет модель закономерностей продаж для различного сочетания региона, товара и прогнозируемого атрибута.

Можно выбрать сочетание линейки продуктов, региона и показателя продаж для просмотра, выберите ряд из дерева раскрывающийся список модели вкладки.

Что можно узнать, просматривая модель в виде дерева? Например, сравним две модели, одна из которых имеет дерево из нескольких уровней, а другая только один узел.

  • Если дерево содержит один узел, то это значит, что тренд, обнаруженный в модели, практически однороден во времени. Можно использовать этот единственный узел с меткой все, чтобы просмотреть формулу, которая описывает связь между входными переменными и результат.

  • Если дерево для временного ряда содержит несколько ветвей, то это значит, что обнаруженный временной ряд оказался слишком сложный и его нельзя выразить одной формулой. Вместо этого дерево может содержать несколько ветвей, каждая помечается условиями, которые привели к разбиения. Когда дерево разбивается, каждая ветвь представляет отдельный сегмент времени, в котором тренд можно выразить одной формулой.

    Например, если вы посмотрите на графике и обнаруживается внезапный скачок объема продаж, начиная в сентябре и захватывающий Новогодние праздники, можно переключиться на модели для просмотра точную дату изменения тренда. Ветви дерева, представляющие «до сентября» и «после сентября» будут содержать разные формулы: одна формула математически описывает тренды продаж до разбиения и другая формула описывает тренды продаж с сентября до новогодних праздников.

Просмотр дерева принятия решений для модели временных рядов

  1. В дерева списке модели средства просмотра, выберите T1000 Europe: сумма рядов.

    Щелкните узел с меткой все.

    Для все узла, всплывающую подсказку, отображаемую включает сведения, такие как количество вариантов во всем ряду и уравнения временного ряда на основе анализа данных.

  2. Если обозначения интеллектуального анализа данных не отображается, щелкните правой кнопкой мыши узел и выберите Показать условные обозначения.

    Обозначения интеллектуального анализа данных предоставляет намного ту же информацию, что в подсказке. Если любые из независимых переменных являются дискретными, также выводится гистограмма с распределением переменных в узле.

  3. Теперь выберите для просмотра другой временной ряд. С помощью дерева списке модели средства просмотра, выберите M200 North America: сумма рядов.

    Диаграмма дерева сейчас содержит все узел с двумя дочерними узлами. По меткам дочерних узлов можно понять, в какой момент изменилась линия тренда.

    Для каждого дочернего узла, описание в обозначения интеллектуального анализа данных также включает число вариантов в каждой ветви дерева.

В следующем списке описаны некоторые дополнительные функции средства просмотра деревьев.

  • Можно изменить переменную, представленную на диаграмме с помощью Фон элемента управления. По умолчанию более темные узлы содержат больше вариантов, так как значение Фон равен Заполнение. Чтобы увидеть только количество вариантов в узле, наведите указатель мыши на узел и просмотреть подсказку, которая появляется, или щелкните узел и просмотрите числа в условные обозначения узла окна.

  • Формулу регрессии для узла также можно просмотреть во всплывающей подсказке или щелкнув узел. Если создана смешанная модель, можно просмотреть две формулы: одну для ARTXP (в конечных узлах) и одну для ARIMA (в корневом узле дерева).

  • В узлах, представляющих непрерывные числа, используются маленькие ромбы. Диапазон атрибутов показан в линейке, на которой находится ромб. Центр ромба расположен над средним значением для узла, а ширина ромба представляет дисперсию атрибута в этом узле.

В начало

Средство просмотра деревьев содержимого общего вида (необязательно)

Помимо пользовательское средство просмотра временных рядов Службы Analysis Services предоставляет средство просмотра деревьев содержимого MicrosoftGeneric для работы с моделями интеллектуального анализа данных. Это средство просмотра обладает некоторыми преимуществами.

  • Средство просмотра временных рядов Майкрософт: в этом представлении объединяются результаты двух алгоритмов. Каждый ряд можно просматривать отдельно, но нельзя определить, как сочетаются результаты действия каждого алгоритма. Кроме того, в этом представлении в подсказках и обозначениях интеллектуального анализа данных выводится только самая важная статистика.

  • Просмотра деревьев содержимого общего: можно найти и просмотреть все ряды данных, которые использовались в модели одновременно и, если создана смешанная модель, оба ARIMA и деревьев ARTXP отображаются на одной диаграмме.

    Это средство просмотра позволяет получить всю статистику по обоим алгоритмам, а также распределение значений.

    Рекомендуется для пользователей, обладающих опытом интеллектуального анализа данных и желающих получить дополнительные сведения об алгоритмах анализа ARIMA и ARTXP.

Просмотр сведений для определенного ряда данных в средстве просмотра содержимого общего вида

  1. В средство просмотра модели интеллектуального анализа выберите Microsoft просмотра деревьев содержимого общего из просмотра раскрывающегося списка.

  2. В заголовок узла панели, щелкните самый верхний узел (все).

  3. В сведения об узле области просмотра значения для ATTRIBUTE_NAME.

    Данное значение указывает, какой ряд, или сочетание товара и региона, содержится в этом узле. В примере с фирмой AdventureWorks самый верхний узел соответствует ряду M200 Europe.

  4. В заголовок узла панели найдите первый узел, содержащий дочерние узлы.

    Если узел ряда имеет дочерние элементы, представлении в виде дерева, которое отображается на модель средства просмотра временных рядов Майкрософт также будет иметь разветвленную структуру.

  5. Разверните узел и щелкните один из его дочерних узлов.

    Столбец NODE_DESCRIPTION схемы содержит условие, которые привело к разбиению дерева.

  6. В заголовок узла щелкните самый верхний узел ARIMA и разверните узел, пока не будут видны все дочерние узлы.

  7. В сведения об узле области просмотра значения для ATTRIBUTE_NAME.

    Данное значение указывает, какой ряд содержится в этом узле. Самый верхний узел в разделе ARIMA должен совпадать с самым верхним узлом в разделе («Все»). В примере с фирмой AdventureWorks данный узел содержит результаты алгоритма ARIMA для ряда M200 Europe.

Дополнительные сведения см. в разделе Интеллектуальный анализ содержимого моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных).

В начало

Следующая задача занятия

Создание прогнозов временных рядов ( учебник по интеллектуальному анализу данных — средний )

См. также:

Примеры запросов моделей временных рядов
Технический справочник по алгоритму временных рядов (Майкрософт)