Изменение параметров таблицы счетчиков
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Изменяет параметры, используемые для создания компонентов из счетчиков
категория: Обучение с количеством
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Обзор модуля
в этой статье описывается, как использовать модуль параметров таблицы изменения числа в Машинное обучение Studio (классическая модель) для изменения способа создания функций из таблицы подсчета.
Как правило, для создания функций на основе счетчиков используется Преобразование подсчета сборок для обработки набора данных и создания таблицы счетчиков, а из этой таблицы счетчиков — создание нового набора функций.
Однако если таблица счетчиков уже создана, можно использовать модуль изменение параметров таблицы счетчиков , чтобы изменить определение способа обработки данных счетчика. Это позволяет создать другой набор статистики на основе количества на основе существующих данных без необходимости повторного анализа набора данных.
Настройка параметров счетчика изменений
Выберите преобразование, которое необходимо изменить, в группе преобразования и добавьте его в свой эксперимент.
Необходимо предварительно запустить эксперимент, в котором было создано преобразование «подсчет».
Чтобы изменить сохраненное преобразование, выберите преобразование в группе преобразования и добавьте его в свой эксперимент.
Изменение преобразования Count, созданного в рамках одного эксперимента: если преобразование не было сохранено, но доступно в качестве выходных данных в текущем эксперименте (например, проверьте выходные данные модуля преобразования подсчета сборки ), можно использовать его напрямую, подключив модули.
Добавьте модуль " изменение параметров таблицы подсчетов " и Соедините преобразование в качестве входных данных.
В области Свойства модуля Параметры изменения таблицы счетчиков введите значение, которое будет использоваться в качествепорогового значения для ячейки мусора.
Это значение указывает минимальное количество вхождений, которое должно быть найдено для каждого значения компонента, чтобы использовать счетчики. Если частота значения меньше порога в ячейке сборщика мусора, то пара «значение-метка» не учитывается как дискретный элемент. Вместо этого все элементы с количеством, меньшим, чем пороговое значение, помещаются в одну «мусорную корзину».
Если вы используете небольшой набор данных и подсчитываете и обучение одни и те же данные, хорошее начальное значение равно 1.
Для дополнительных предыдущих примероввведите число, указывающее количество дополнительных примеров для включения. Вам не нужно указывать эти примеры. псевдокод создается на основе прежнего распределения.
Для параметра лапласовского шумов Scale (шкала шума) введите положительное значение с плавающей запятой, которое представляет масштаб, используемый для введения шума из лапласовского распределения. При установке значения шкалы в модель включается некоторый приемлемый уровень шума, поэтому на модель, скорее всего, будут затронуты невидимые значения в данных.
В поле выходные функциивыберите метод, который будет использоваться при создании функций на основе счетчика для включения в преобразование.
Каунтсонли: Создание функций с помощью счетчиков.
Логоддсонли: Создайте функции, используя журнал вероятного соотношения.
Боскаунтсандлогоддс: Создавайте функции, используя как счетчики, так и журналы.
Выберите параметр пропустить столбец , если требуется переопределить
IsBackOff
флаг в выходных данных при создании компонентов. Если выбран этот параметр, функции на основе счетчиков создаются, даже если столбец не имеет значимых значений счетчика.Запустите эксперимент. При необходимости можно сохранить выходные данные параметров таблицы изменить число в новом преобразовании.
Примеры
Примеры того, как этот модуль, см. в Коллекция решений ии Azure:
Обучение с количеством: двоичная классификация: демонстрируется использование модулей обучения с подсчетами для создания функций из столбцов значений категорий для модели двоичной классификации.
Обучение со счетчиками: многоклассовая классификация с данными нью такси: образец демонстрирует использование модулей Learning с счетчиками для выполнения многоклассовой классификации в общедоступном наборе данных нью такси. В примере используется Многоклассовый источник логистической регрессии для моделирования этой проблемы.
Обучение со счетчиками: двоичная классификация с данными о такси нью: демонстрируется использование модулей Learning с счетчиками для выполнения двоичной классификации в общедоступном наборе данных нью такси. Для моделирования этой проблемы в образце используется пошаговое изучение логистической регрессии с двумя классами.
Технические примечания
В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.
Подсчет и обучение на основе одного и того же набора является статистическим надежным, если задан параметр шкалы шума Лапласа.
Ожидаемые входные данные
Имя | Тип | Описание |
---|---|---|
Преобразование подсчета | Интерфейс ITransform | Применяемое преобразование подсчета |
Параметры модуля
Имя | Type | Диапазон | Необязательно | Значение по умолчанию | Описание |
---|---|---|---|---|---|
Пороговое значение контейнера для сбора мусора | Float | >= 0.0 f | Обязательно | 10.0 f | Порог, при достижении которого значение столбца будет признаками для корзины мусора |
Дополнительные априорные псевдопримеры | Float | >= 0.0 f | Обязательно | 42,0f | Дополнительные псевдокоды, следующие за ранее распространяемыми распределениями |
Шкала шума Лапласа | Float | >= 0.0 f | Обязательно | указано | Масштаб распределения Лапласовского, из которого выдается выборка шума |
Состав выходных признаков | OutputFeatureType | Обязательно | BothCountsAndLogOdds | Выводимые функции | |
Игнорировать столбец отхода | Логическое | Обязательно | false | Следует ли игнорировать столбец Исбаккофф в выходных данных |
Выходные данные
Имя | Тип | Описание |
---|---|---|
Измененное преобразование | Интерфейс ITransform | Измененное преобразование |
Исключения
Исключение | Описание |
---|---|
Ошибка 0003 | Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты. |
Ошибка 0086 | Возникает исключение при недопустимом преобразовании подсчета. |
список ошибок, относящихся к модулям студии (классическая версия), см. в разделе Машинное обучение коды ошибок.
список исключений API см. в разделе Машинное обучение REST API коды ошибок.