Поделиться через


Изменение параметров таблицы счетчиков

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Изменяет параметры, используемые для создания компонентов из счетчиков

категория: Обучение с количеством

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается, как использовать модуль параметров таблицы изменения числа в Машинное обучение Studio (классическая модель) для изменения способа создания функций из таблицы подсчета.

Как правило, для создания функций на основе счетчиков используется Преобразование подсчета сборок для обработки набора данных и создания таблицы счетчиков, а из этой таблицы счетчиков — создание нового набора функций.

Однако если таблица счетчиков уже создана, можно использовать модуль изменение параметров таблицы счетчиков , чтобы изменить определение способа обработки данных счетчика. Это позволяет создать другой набор статистики на основе количества на основе существующих данных без необходимости повторного анализа набора данных.

Настройка параметров счетчика изменений

  1. Выберите преобразование, которое необходимо изменить, в группе преобразования и добавьте его в свой эксперимент.

    Необходимо предварительно запустить эксперимент, в котором было создано преобразование «подсчет».

    • Чтобы изменить сохраненное преобразование, выберите преобразование в группе преобразования и добавьте его в свой эксперимент.

    • Изменение преобразования Count, созданного в рамках одного эксперимента: если преобразование не было сохранено, но доступно в качестве выходных данных в текущем эксперименте (например, проверьте выходные данные модуля преобразования подсчета сборки ), можно использовать его напрямую, подключив модули.

  2. Добавьте модуль " изменение параметров таблицы подсчетов " и Соедините преобразование в качестве входных данных.

  3. В области Свойства модуля Параметры изменения таблицы счетчиков введите значение, которое будет использоваться в качествепорогового значения для ячейки мусора.

    Это значение указывает минимальное количество вхождений, которое должно быть найдено для каждого значения компонента, чтобы использовать счетчики. Если частота значения меньше порога в ячейке сборщика мусора, то пара «значение-метка» не учитывается как дискретный элемент. Вместо этого все элементы с количеством, меньшим, чем пороговое значение, помещаются в одну «мусорную корзину».

    Если вы используете небольшой набор данных и подсчитываете и обучение одни и те же данные, хорошее начальное значение равно 1.

  4. Для дополнительных предыдущих примероввведите число, указывающее количество дополнительных примеров для включения. Вам не нужно указывать эти примеры. псевдокод создается на основе прежнего распределения.

  5. Для параметра лапласовского шумов Scale (шкала шума) введите положительное значение с плавающей запятой, которое представляет масштаб, используемый для введения шума из лапласовского распределения. При установке значения шкалы в модель включается некоторый приемлемый уровень шума, поэтому на модель, скорее всего, будут затронуты невидимые значения в данных.

  6. В поле выходные функциивыберите метод, который будет использоваться при создании функций на основе счетчика для включения в преобразование.

    • Каунтсонли: Создание функций с помощью счетчиков.

    • Логоддсонли: Создайте функции, используя журнал вероятного соотношения.

    • Боскаунтсандлогоддс: Создавайте функции, используя как счетчики, так и журналы.

  7. Выберите параметр пропустить столбец , если требуется переопределить IsBackOff флаг в выходных данных при создании компонентов. Если выбран этот параметр, функции на основе счетчиков создаются, даже если столбец не имеет значимых значений счетчика.

  8. Запустите эксперимент. При необходимости можно сохранить выходные данные параметров таблицы изменить число в новом преобразовании.

Примеры

Примеры того, как этот модуль, см. в Коллекция решений ии Azure:

Технические примечания

В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.

Подсчет и обучение на основе одного и того же набора является статистическим надежным, если задан параметр шкалы шума Лапласа.

Ожидаемые входные данные

Имя Тип Описание
Преобразование подсчета Интерфейс ITransform Применяемое преобразование подсчета

Параметры модуля

Имя Type Диапазон Необязательно Значение по умолчанию Описание
Пороговое значение контейнера для сбора мусора Float >= 0.0 f Обязательно 10.0 f Порог, при достижении которого значение столбца будет признаками для корзины мусора
Дополнительные априорные псевдопримеры Float >= 0.0 f Обязательно 42,0f Дополнительные псевдокоды, следующие за ранее распространяемыми распределениями
Шкала шума Лапласа Float >= 0.0 f Обязательно указано Масштаб распределения Лапласовского, из которого выдается выборка шума
Состав выходных признаков OutputFeatureType Обязательно BothCountsAndLogOdds Выводимые функции
Игнорировать столбец отхода Логическое Обязательно false Следует ли игнорировать столбец Исбаккофф в выходных данных

Выходные данные

Имя Тип Описание
Измененное преобразование Интерфейс ITransform Измененное преобразование

Исключения

Исключение Описание
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.
Ошибка 0086 Возникает исключение при недопустимом преобразовании подсчета.

список ошибок, относящихся к модулям студии (классическая версия), см. в разделе Машинное обучение коды ошибок.

список исключений API см. в разделе Машинное обучение REST API коды ошибок.

См. также раздел

Обучение с учетом количества