Поделиться через


Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Алгоритм интеллектуального анализа данных представляет собой механизм, создающий модель интеллектуального анализа данных. Чтобы создать модель, алгоритм сначала анализирует набор данных, осуществляя поиск определенных закономерностей и трендов. Алгоритм использует результаты этого анализа для определения параметров модели интеллектуального анализа данных. Затем эти параметры применяются ко всему набору данных, чтобы выявить пригодные к использованию закономерности и получить подробную статистику.

Модель интеллектуального анализа данных, созданная алгоритмом, может иметь различные формы, включая следующие.

  • Набор правил, описывающих группирование продуктов в транзакции.

  • Дерево принятия решений, прогнозирующее, купит ли конкретный заказчик продукт.

  • Математическую модель, прогнозирующую продажи.

  • Набор кластеров, описывающих связи вариантов в наборе данных.

Службы MicrosoftSQL ServerAnalysis Services предоставляют несколько алгоритмов для использования в решениях интеллектуального анализа данных. Эти алгоритмы являются подмножеством всех алгоритмов, которые могут использоваться для интеллектуального анализа данных. Можно также использовать алгоритмы сторонних производителей, соответствующие спецификации OLE DB для интеллектуального анализа данных. Дополнительные сведения об алгоритмах сторонних производителей см. в разделе Подключаемые алгоритмы.

Типы алгоритмов интеллектуального анализа данных

Службы Analysis Services включают следующие типы алгоритмов.

  • Алгоритмы классификации осуществляют прогнозирование одной или нескольких дискретных переменных на основе других атрибутов в наборе данных. Примером алгоритма классификации является Алгоритм дерева принятия решений (Майкрософт).

  • Регрессивные алгоритмы осуществляют прогнозирование одной или нескольких непрерывных переменных, например прибыли или убытков, на основе других атрибутов в наборе данных. Примером регрессивного алгоритма является Алгоритм временных рядов (Майкрософт).

  • Алгоритмы сегментации делят данные на группы или кластеры элементов, имеющих схожие свойства. Примером алгоритма сегментации является Алгоритм кластеризации (Майкрософт).

  • Алгоритмы взаимосвязей осуществляют поиск корреляции между различными атрибутами в наборе данных. Наиболее частым применением этого типа алгоритма является создание правил взаимосвязи, которые могут использоваться для анализа потребительской корзины. Примером алгоритма взаимосвязей является Алгоритм взаимосвязей (Майкрософт).

  • Алгоритмы анализа последовательностей обобщают часто встречающиеся последовательности в данных, например поток данных в Интернете. Примером алгоритма анализа последовательностей является Алгоритм кластеризации последовательностей (Майкрософт).

Применение алгоритмов

Выбор правильного алгоритма для использования в конкретной экономической задаче может быть достаточно сложным. В то время как можно использовать различные алгоритмы для выполнения одной и той же задачи, каждый алгоритм выдает различный результат, а некоторые алгоритмы могут выдавать более одного типа результатов. Например, можно использовать алгоритм дерева принятия решений (Майкрософт) не только для прогнозирования, но также в качестве способа уменьшения количества столбцов в наборе данных, поскольку дерево принятия решений может идентифицировать столбцы, не влияющие на конечную модель интеллектуального анализа данных.

Не обязательно применять алгоритмы независимо друг от друга. В одном решении интеллектуального анализа данных можно использовать несколько алгоритмов для просмотра данных, а затем на основе результатов предсказать конкретный итог с помощью других алгоритмов. Например, можно использовать алгоритм кластеризации, распознающий закономерности, для разделения данных на группы, являющиеся более или менее однородными, а затем использовать эти результаты для создания более точной модели дерева принятия решений. Можно использовать несколько алгоритмов в одном решении для выполнения различных задач, например алгоритм дерева регрессии для получения данных для финансового прогнозирования и алгоритм на основе правил для выполнения анализа потребительской корзины.

Модели интеллектуального анализа данных могут прогнозировать значения, создавать обобщения данных и находить скрытые корреляции. Для облегчения выбора алгоритмов для решения интеллектуального анализа данных в следующей таблице приведены рекомендации по использованию алгоритмов для конкретных задач.

Задача

Подходящие алгоритмы Майкрософт

Прогнозирование дискретного атрибута.

В качестве примера можно выполнить прогноз того, купит ли получатель целевой рассылки определенный продукт.

Алгоритм дерева принятия решений (Майкрософт)

Упрощенный алгоритм Байеса (Майкрософт)

Алгоритм кластеризации (Майкрософт)

Алгоритм нейронной сети (Майкрософт)

Прогнозирование непрерывного атрибута.

Например, прогноз продаж на следующий год.

Алгоритм дерева принятия решений (Майкрософт)

Алгоритм временных рядов (Майкрософт)

Прогнозирование последовательности.

Например, анализ маршрута перемещения по веб-узлу компании.

Алгоритм кластеризации последовательностей (Майкрософт)

Нахождение групп общих элементов в транзакциях.

Например, использование анализа покупательского поведения для предложения дополнительных продуктов заказчику.

Алгоритм взаимосвязей (Майкрософт)

Алгоритм дерева принятия решений (Майкрософт)

Нахождение групп схожих элементов.

Например, разбиение демографических данных на группы для лучшего понимания связей между атрибутами.

Алгоритм кластеризации (Майкрософт)

Алгоритм кластеризации последовательностей (Майкрософт)

Поскольку каждая модель возвращает различные типы результата, службы Analysis Services предоставляют отдельное средство просмотра для каждого алгоритма. При просмотре модели интеллектуального анализа данных в службах Analysis Services модель отображается на вкладке Средство просмотра моделей интеллектуального анализа данных конструктора интеллектуального анализа данных с использованием соответствующего средства просмотра для данной модели. Дополнительные сведения см. в разделе Просмотр модели интеллектуального анализа данных.

Подробные сведения об алгоритмах

В следующей таблице приводятся ссылки на типы сведений, доступных для каждого алгоритма.

  • Общее описание алгоритма.   Содержит общее объяснение работы алгоритма и пример бизнес-сценария, в котором алгоритм может быть полезен.

  • Технический справочник.  Приводит список параметров, с помощью которых можно управлять работой алгоритма и изменять результаты в модели. Содержит дополнительные технические данные о реализации алгоритма, советы по повышению производительности и требования к данным.

  • Запросы к модели. Предоставляет примеры запросов, которые можно использовать с моделями каждого типа.Можно запрашивать модель для получения дополнительных сведений о закономерностях в модели и для составления прогнозов на основе этих закономерностей.

  • Содержимое модели интеллектуального анализа данных.   Описывает, каким образом данные хранятся в общей структуре для всех типов моделей, и объясняет, как интерпретировать эти данные. После построения модели можно просмотреть ее с помощью средств просмотра, доступных в среде BI Development Studio, или написать запросы для получения данных непосредственно из содержимого модели, используя расширения интеллектуального анализа данных.

Общее описание алгоритма

Технический справочник

Запросы

Содержимое модели интеллектуального анализа данных

Алгоритм взаимосвязей (Майкрософт)

Технический справочник по алгоритму взаимосвязей (Майкрософт)-

Запрос модели взаимосвязей (службы Analysis Services — интеллектуальный анализ данных)

Содержимое моделей интеллектуального анализа данных для моделей взаимосвязей (службы Analysis Services — интеллектуальный анализ данных)

Алгоритм кластеризации (Майкрософт)

Технический справочник по алгоритму кластеризации (Майкрософт)

Запрос модели кластеризации (службы Analysis Services — интеллектуальный анализ данных)

Содержимое моделей интеллектуального анализа данных для моделей кластеризации (службы Analysis Services — интеллектуальный анализ данных)

Алгоритм дерева принятия решений (Майкрософт)

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

Запрос модели дерева принятия решений (службы Analysis Services — интеллектуальный анализ данных)

Содержимое моделей интеллектуального анализа данных для моделей дерева принятия решений (службы Analysis Services — интеллектуальный анализ данных)

Алгоритм линейной регрессии (Microsoft)

Технический справочник по алгоритму линейной регрессии (Майкрософт)

Запросы к модели линейной регрессии (службы Analysis Services - интеллектуальный анализ данных)

Содержимое моделей интеллектуального анализа данных для моделей линейной регрессии (службы Analysis Services — интеллектуальный анализ данных)

Алгоритм логистической регрессии (Майкрософт)

Технический справочник по алгоритму логистической регрессии (Майкрософт)

Запросы к модели логистической регрессии (службы Analysis Services — интеллектуальный анализ данных)

Содержимое моделей интеллектуального анализа данных для моделей логистической регрессии (службы Analysis Services — интеллектуальный анализ данных)

Упрощенный алгоритм Байеса (Майкрософт)

Технический справочник по упрощенному алгоритму Байеса (Майкрософт)

Запрос модели упрощенного алгоритма Байеса (службы Analysis Services — интеллектуальный анализ данных)

Содержимое моделей интеллектуального анализа данных для моделей упрощенного алгоритма Байеса (службы Analysis Services — интеллектуальный анализ данных)

Алгоритм нейронной сети (Майкрософт)

Технический справочник по алгоритму нейронной сети (Майкрософт)

Запросы к модели нейронной сети (Майкрософт) (службы Analysis Services — интеллектуальный анализ данных)

Содержимое моделей интеллектуального анализа данных для моделей нейронных сетей (службы Analysis Services — интеллектуальный анализ данных)

Алгоритм кластеризации последовательностей (Майкрософт)

Технический справочник по алгоритму кластеризации последовательностей (Майкрософт)

Запросы к модели кластеризации последовательностей (службы Analysis Services — интеллектуальный анализ данных)

Содержимое моделей интеллектуального анализа данных для моделей кластеризации последовательностей (службы Analysis Services — интеллектуальный анализ данных)

Алгоритм временных рядов (Майкрософт)

Технический справочник по алгоритму временных рядов (Майкрософт)

Запрос модели временных рядов (службы Analysis Services — интеллектуальный анализ данных)

Содержимое модели интеллектуального анализа данных для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных)