Поделиться через


Преобразование данных

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

в этой статье перечислены модули, предоставляемые в Машинное обучение Studio (классическая модель) для преобразования данных. Для машинного обучения Преобразование данных влечет за собой некоторые очень общие задачи, такие как объединение наборов данных или изменение имен столбцов. Но он также включает множество задач, характерных для машинного обучения, таких как нормализация, группирования и группирование, а также вывод недостающих значений.

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Важно!

перед импортом в Машинное обучение studio (классическая модель) данные, используемые в Машинное обучение Studio (классическая модель), обычно должны быть «незаполненными». Подготовка данных может включать в себя, например, гарантию того, что данные используют правильную кодировку, и проверять, что данные имеют единообразную схему.

Модули для преобразования данных группируются в следующие категории на основе задач.

  • Создание фильтров для обработки цифровых сигналов. Фильтры цифровых сигналов можно применять к числовым данным для поддержки задач машинного обучения, таких как распознавание изображений, распознавание речи и анализ аудио.
  • Создание и использование функций на основе счетчиков. модули Добавление признаков на основе счетчиков помогают разрабатывать функции Compact для использования в машинном обучении.
  • Общие операции с данными и подготовка: объединение наборов данных, очистка отсутствующих значений, группирование и суммирование данных, изменение имен столбцов и типов данных, а также указание того, какой столбец является меткой или функцией.
  • Выборка и разделение наборовданных: Разделите данные на обучающий и проверочный наборы, разделите наборы DataSet на проценты или условия фильтра или выполняйте выборку.
  • Масштабирование и уменьшение данных. Подготовьте числовые данные для анализа, применив нормализацию или масштабирование. Данные ячеек помещают в группы, удаляются или заменяют выбросы или выполняют анализ основных компонентов (PCA).

Список модулей

В категорию преобразования «данные » включены следующие категории модулей.

См. также раздел