Прочитать на английском

Поделиться через


Занятие 2: Добавление моделей интеллектуального анализа данных для структуры интеллектуального анализа данных для покупателя велосипеда

 

Применимо к: SQL Server 2016 Preview

На этом занятии будет добавлено две модели интеллектуального анализа данных к структуре интеллектуального анализа данных Bike Buyer, созданный занятия 1: Создание структуры интеллектуального анализа данных для покупателя велосипеда. Эти модели интеллектуального анализа позволяют просматривать данные, используя одну модель, и создавать прогнозы с помощью другой модели.

Для просмотра как потенциальные заказчики могут быть упорядочены по их характеристики, вы создадите модель интеллектуального анализа данных на основе алгоритм кластеризации Майкрософт. На одном из следующих занятий будет изучено, каким образом этот алгоритм находит кластеры заказчиков с похожими характеристиками. Например, может оказаться, что некоторые заказчики живут близко друг от друга, ездят на велосипеде и имеют примерно равный уровень образования. Можно использовать данные кластеры, чтобы лучше понять, каким образом различные заказчики связаны между собой, и использовать эти сведения для создания маркетинговой стратегии, рассчитанной на конкретных заказчиков.

Для прогнозирования вероятности покупки велосипеда ли потенциальный заказчик, вы создадите модель интеллектуального анализа данных на основе алгоритма дерева принятия решений Microsoft. Этот алгоритм просматривает данные, связанные с каждым потенциальным заказчиком, и находит характеристики, релевантные для прогнозирования покупки велосипеда. Затем он сравнивает значения характеристик заказчиков, уже купивших велосипеды, с характеристиками потенциальных заказчиков для определения возможности того, что они купят велосипеды.

Инструкция ALTER MINING STRUCTURE

Используется для добавления модели интеллектуального анализа данных к структуре интеллектуального анализа данных, ALTER MINING STRUCTURE ( расширений интеллектуального анализа данных ) инструкции. Код инструкции можно разбить на следующие части:

  • Определение структуры интеллектуального анализа данных

  • Указание имени модели интеллектуального анализа

  • Определение ключевого столбца

  • Определение столбцов исходных данных и прогнозируемых столбцов

  • Идентификация алгоритма и изменений параметра

В следующем фрагменте показан стандартный пример инструкции ALTER MINING MODEL:

ALTER MINING STRUCTURE [<mining structure name>]  
ADD MINING MODEL [<mining model name>]  
(  
    [<key column>],  
    <mining model columns>,  
) USING <algorithm name>( <algorithm parameters> )  
WITH FILTER (<expression>)  

В первой строке кода идентифицируется существующая структура интеллектуального анализа данных, к которой будут добавлены модели интеллектуального анализа данных:

ALTER MINING STRUCTURE [<mining structure name>]  

В следующей строчке кода модели интеллектуального анализа данных, добавляемой к структуре интеллектуального анализа, присваивается имя:

ADD MINING MODEL [<mining model name>]  

Сведения о присвоении имени объекту в расширениях интеллектуального анализа данных см. в разделе идентификаторы ( расширений интеллектуального анализа данных ).

Следующие строки кода задают столбцы из структуры интеллектуального анализа, которые будут использоваться моделью интеллектуального анализа:

[<key column>],  
<mining model columns>  

Можно использовать только существующие столбцы структуры интеллектуального анализа, причем первый столбец из списка должен быть ключевым столбцом структуры интеллектуального анализа.

В последней строчке кода определяется алгоритм интеллектуального анализа данных, который создает модель интеллектуального анализа, и параметры, которые можно передать алгоритму:

) USING <algorithm name>( <algorithm parameters> )  

Дополнительные сведения о задаваемых параметрах алгоритма см. в разделе алгоритма дерева принятия решений Microsoft и алгоритм кластеризации Майкрософт.

С помощью следующего синтаксиса можно указать столбец модели интеллектуального анализа, который следует использовать для прогнозирования:

<mining model column> PREDICT  

В последней строке кода, которая является необязательной, определяется фильтр, применяемый при обучении и проверке модели. Дополнительные сведения о том, как применять фильтры к моделям интеллектуального анализа данных см. в разделе фильтров для моделей интеллектуального анализа данных и #40; Службы Analysis Services — Интеллектуальный анализ данных ).

Задачи занятия

На этом занятии будут выполнены следующие задачи.

  • Добавление модели интеллектуального анализа данных дерева принятия решений к структуре Bike Buyer с помощью Microsoft алгоритм дерева принятия решений

  • Добавить модель интеллектуального анализа кластеризации к структуре Bike Buyer, используя Microsoft алгоритм кластеризации

  • Поскольку требуется ознакомиться с результатами для всех вариантов, ни для одной модели не должен быть добавлен фильтр.

Добавление модели интеллектуального анализа дерева принятия решений к структуре интеллектуального анализа данных

Первым шагом является добавление модели интеллектуального анализа данных на основе Microsoft алгоритм дерева принятия решений.

Для добавления модели интеллектуального анализа дерева принятия решений

  1. В обозревателя объектов, щелкните правой кнопкой мыши экземпляр Службы Analysis Services, пункты новый запрос, и нажмите кнопку расширений интеллектуального анализа данных для открытия редактора запросов и создать новый, пустой запрос.

  2. Скопируйте стандартный пример использования инструкции ALTER MINING STRUCTURE в пустое окно запроса.

  3. Вместо

    <mining structure name>   
    

    вставьте

    [Bike Buyer]  
    
  4. Вместо

    <mining model name>   
    

    вставьте

    Decision Tree  
    
  5. Вместо

    <mining model columns>,  
    

    вставьте

    (  
       CustomerKey,  
       [Age],  
       [Bike Buyer] PREDICT,  
       [Commute Distance],  
       [Education],  
       [Gender],  
       [House Owner Flag],  
       [Marital Status],  
       [Number Cars Owned],  
       [Number Children At Home],  
       [Occupation],  
       [Region],  
       [Total Children],  
       [Yearly Income]  
    

    В этом случае столбец [Bike Buyer] обозначается как столбец PREDICT.

  6. Вместо

    USING <algorithm name>( <algorithm parameters> )   
    

    вставьте

    Using Microsoft_Decision_Trees  
    WITH DRILLTHROUGH  
    

    Инструкция WITH DRILLTHROUGH позволяет просматривать объекты, использованные для построения модели интеллектуального анализа данных.

    В результате инструкция должна выглядеть следующим образом:

    ALTER MINING STRUCTURE [Bike Buyer]  
    ADD MINING MODEL [Decision Tree]  
    (  
       CustomerKey,  
       [Age],  
       [Bike Buyer] PREDICT,  
       [Commute Distance],  
       [Education],  
       [Gender],  
       [House Owner Flag],  
       [Marital Status],  
       [Number Cars Owned],  
       [Number Children At Home],  
       [Occupation],  
       [Region],  
       [Total Children],  
       [Yearly Income]  
    ) USING Microsoft_Decision_Trees  
    WITH DRILLTHROUGH  
    
  7. В меню Файл щелкните Сохранить DMXQuery1.dmx как.

  8. В Сохранить как диалоговом перейдите к соответствующей папке и присвойте файлу имя DT_Model.dmx.

  9. На панели инструментов нажмите кнопку Выполнить .

Добавление модели интеллектуального анализа кластеризации к структуре интеллектуального анализа данных

Теперь можно добавить модель интеллектуального анализа данных к структуре интеллектуального анализа покупки велосипеда человеком на основе Microsoft алгоритм кластеризации. Поскольку модель интеллектуального анализа данных кластеризации будет использовать все столбцы, определенные в структуре интеллектуального анализа данных, можно использовать контекстное меню, чтобы добавить модель к структуре без определения столбцов интеллектуального анализа данных.

Добавление модели интеллектуального анализа кластеризации

  1. В обозревателя объектов, щелкните правой кнопкой мыши экземпляр Службы Analysis Services, пункты новый запрос, и нажмите кнопку расширений интеллектуального анализа данныхЧтобы открыть редактор запросов и создать новый, пустой запрос.

  2. Скопируйте стандартный пример использования инструкции ALTER MINING STRUCTURE в пустое окно запроса.

  3. Вместо

    <mining structure name>   
    

    вставьте

    [Bike Buyer]  
    
  4. Вместо

    <mining model>   
    

    вставьте

    Clustering Model  
    
  5. Удалите:

    (  
        [<key column>],  
        <mining model columns>,  
    )  
    
  6. Вместо

    USING <algorithm name>( <algorithm parameters> )  
    

    вставьте

    USING Microsoft_Clustering  
    

    Полная инструкция теперь должна выглядеть следующим образом.

    ALTER MINING STRUCTURE [Bike Buyer]  
    ADD MINING MODEL [Clustering]  
    USING Microsoft_Clustering   
    
  7. В меню Файл щелкните Сохранить DMXQuery1.dmx как.

  8. В Сохранить как диалоговом перейдите к соответствующей папке и присвойте файлу имя Clustering_Model.dmx.

  9. На панели инструментов нажмите кнопку Выполнить .

На следующем занятии вы научитесь обрабатывать модели и структуры интеллектуального анализа.

Следующее занятие

Занятие 3: Обработка структуры интеллектуального анализа данных для покупателя велосипеда