Поделиться через


SystemGetAccuracyResults (службы Analysis Services — интеллектуальный анализ данных)

Возвращает показатели точности перекрестной проверки для структуры интеллектуального анализа и всех связанных с ней моделей, исключая модели кластеризации.

Эта хранимая процедура возвращает показатели для всего набора данных как единой секции. Чтобы выполнить секционирование набора данных на перекрестные разделы и вернуть метрики для каждой секции, используйте метод SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

ПримечаниеПримечание

Эта хранимая процедура не поддерживается для моделей, построенных с помощью алгоритма временных рядов (Майкрософт) или алгоритма кластеризации последовательностей (Майкрософт). Кроме того, для кластеризованных моделей используется отдельная хранимая процедура, Метод SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Синтаксис

SystemGetAccuracyResults(<mining structure>, 
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Аргументы

  • mining structure
    Имя структуры интеллектуального анализа данных в текущей базе данных.

    (обязательно)

  • model list
    Список моделей для проверки с разделителями-запятыми.

    Значение по умолчанию — null. Это означает, что используются все применимые модели. При использовании значения по умолчанию кластеризованные модели автоматически исключаются из списка обработки.

    (необязательно)

  • data set
    Целочисленное значение, указывающее, что секция в структуре интеллектуального анализа используется для тестирования. Это значение получается из битовой маски, которая представляет сумму следующих значений, каждое из которых в отдельности является необязательным:

    Обучающие варианты

    0x0001

    Проверочные варианты

    0x0002

    Фильтр модели

    0x0004

    Полный список возможных значений см. в подразделе «Примечания» этого раздела.

    (обязательно)

  • target attribute
    Строка, содержащая имя прогнозируемого объекта. Прогнозируемый объект может быть столбцом, вложенным столбцом таблицы или вложенным ключевым столбцом модели интеллектуального анализа данных.

    (обязательно)

  • target state
    Строка, содержащая конкретное значения для прогноза.

    Если значение задано, показатели собираются для данного конкретного состояния.

    Если значение не задано или равно NULL, показатели вычисляются для более вероятного состояния каждого прогноза.

    Значение по умолчанию — null.

    (необязательно)

  • target threshold
    Число от 0,0 до 1, определяющее минимальную вероятность, при которой прогнозируемое значение будет считаться правильным.

    По умолчанию это значение равно null, оно означает, что правильными считаются все прогнозы.

    (необязательно)

  • test list
    Строка, указывающая параметры тестирования. Этот параметр зарезервирован для использования в будущем.

    (необязательно)

Тип возвращаемых данных

Возвращенный набор строк содержит оценки по каждой секции и статистической функции для всех моделей.

Следующая таблица содержит список столбцов, возвращаемых методом GetValidationResults.

Имя столбца

Описание

Model

Имя протестированной модели. Значение Все указывает, что результат представляет собой статистическое выражение, полученное для всех моделей.

AttributeName

Имя прогнозируемого столбца.

AttributeState

Целевое значение в прогнозируемом столбце.

Если столбец содержит значение, показатели собираются только для заданного состояния.

Если значение не задано или равно NULL, показатели вычисляются для наиболее вероятного состояния каждого прогноза.

PartitionIndex

Определяет секцию, к которой применяется результат.

Для этой процедуры значение всегда равно 0.

PartitionCases

Целое число, указывающее количество строк в наборе вариантов, основанное на параметре <data set>.

Test

Тип выполненного теста.

Measure

Имя меры, возвращенной тестом. Меры для каждой модели зависят от типа модели и типа прогнозируемого значения.

Список мер, возвращаемых для каждого прогнозируемого типа см. в разделе Отчет перекрестной проверки (службы Analysis Services — интеллектуальный анализ данных).

Определение каждой меры см. в разделе Перекрестная проверка (службы Analysis Services — интеллектуальный анализ данных).

Value

Значение для заданной меры.

Замечания

В следующей таблице приводятся примеры значений, с помощью которых можно указать в структуре интеллектуального анализа данные, используемые для перекрестной проверки. Если для перекрестной проверки нужно использовать проверочные варианты, то структура интеллектуального анализа данных должна содержать набор проверочных данных. Сведения о том, как определить набор проверочных данных во время создания структуры интеллектуального анализа данных, см. в разделе Секционирование данных на обучающий и проверочный наборы данных (службы Analysis Services — интеллектуальный анализ данных).

Целое значение

Описание

1

Используются только обучающие варианты.

2

Используются только проверочные варианты.

3

Используются и обучающие и проверочные варианты.

4

Недопустимое сочетание.

5

Используются только обучающие варианты, и применяется фильтр модели.

6

Используются только проверочные варианты, и применяется фильтр модели.

7

Используются и обучающие и проверочные варианты, и применяется фильтр модели.

Дополнительные сведения о сценариях, в которых применяется перекрестная проверка, см. в разделе Проверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Примеры

Этот пример возвращает меры точности для одной модели дерева принятия решений, v Target Mail DT, связанного со структурой интеллектуального анализа vTargetMail. Код в четвертой строке указывает, что результаты должны быть основаны на вариантах проверки, отфильтрованных конкретным фильтром для каждой модели. [Bike Buyer] задает столбец для прогноза, а значение 1 на следующей строке указывает, что модель необходимо оценивать только для заданной цифры 1, означающей «Да, купит».

В последней строке кода задано пороговое значение состояния, равное 0,5. Оно означает, что прогнозы с вероятностью более 50 процентов при вычислении точности следует продолжать как «хорошие».

CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)

Образец результатов:

ModelName

AttributeName

AttributeState

PartitionIndex

PartitionSize

Test

Measure

Value

v Target Mail DT

Bike Buyer

1

0

1638

Classification

True Positive

605

v Target Mail DT

Bike Buyer

1

0

1638

Classification

False Positive

177

v Target Mail DT

Bike Buyer

1

0

1638

Classification

True Negative

501

v Target Mail DT

Bike Buyer

1

0

1638

Classification

False Negative

355

v Target Mail DT

Bike Buyer

1

0

1638

Likelihood

Log Score

-0.598454638753028

v Target Mail DT

Bike Buyer

1

0

1638

Likelihood

Lift

0.0936717116894395

v Target Mail DT

Bike Buyer

1

0

1638

Likelihood

Root Mean Square Error

0.361630800104946

Требования

Перекрестная проверка доступна только в версиях SQL Server Enterprise, начиная с SQL Server 2008.