Преобразование в ARFF
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Преобразует входные данные в формат файла связи атрибутов, который используется инструментарием Weka.
Категория: преобразования форматов данных
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Обзор модуля
в этой статье описывается, как использовать модуль convert to ARFF в Машинное обучение Studio (классическая модель) для преобразования наборов данных и результатов в формат файла связи атрибутов, используемый набором инструментов Weka. Этот формат известен как ARFF.
Спецификация данных ARFF для weka поддерживает несколько задач машинного обучения, включая предварительную обработку данных, классификацию и выбор компонентов. В этом формате данные упорядочены по показателями и их атрибутам и содержатся в одном текстовом файле. Подробные сведения о формате файла weka можно найти в разделе Технические примечания .
как правило, преобразование в формат файла Weka требуется только в том случае, если вы хотите использовать как Машинное обучение, так и Weka и хотите перемещать обучающие данные между ними.
Дополнительные сведения о наборе инструментов weka см. в статье Википедии: weka (машинное обучение) .
Предупреждение
Невозможно перезаписать существующий файл ARFF в службу хранилища Azure.
Использование Convert to ARFF
Добавьте модуль Convert to ARFF в свой эксперимент. этот модуль можно найти в категории преобразования форматов данных в Машинное обучение Studio (классическая модель).
Подключите его к любому модулю, который выводит набор данных.
Запустите эксперимент или выберите модуль преобразовать в ARFF и нажмите кнопку Выполнить выбранное.
Результаты
Чтобы создать копию данных в локальной папке, дважды щелкните выходные данные Convert to ARFFи выберите параметр Download (загрузить ).
Если папка не указана, применяется имя файла по умолчанию и файл сохраняется в локальной библиотеке загрузок .
Примечание
Этот модуль не поддерживает экспорт в код Python или R.
Примеры
В Коллекция решений ии Azureнет примеров, относящихся к этому формату. Однако эти эксперименты демонстрируют другие типы преобразования форматов:
Сжатие изображений на основе цветов: экспортирует наборы данных, используемые для каждой части анализа, в файлы для воспроизводимость и использования на других платформах аналитики.
Перекрестная проверка для примера двоичной классификации: экспортирует результаты перекрестной проверки в файлы, чтобы результаты для нескольких моделей можно было сравнивать с помощью такого средства, как Excel.
Технические примечания
В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.
Пример формата ARFF
В этом разделе приведен пример того, как типичный набор данных будет выглядеть при преобразовании в ARFF.
Обычно файл данных ARFF состоит из двух разделов: заголовка , определяющего источник данных и схему, и раздела данных , содержащего фактические сущности и их атрибуты.
Заголовок ARFF
Заголовок для файла ARFF определяет список атрибутов (в столбцах) и их типы данных. Заголовок также может содержать несколько строк комментариев, описывающих источник данных, или другие примечания.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Совет
Если в преобразуемом наборе данных отсутствуют имена столбцов, используйте модуль изменение метаданных для добавления имен столбцов перед использованием преобразования в ARFF.
Данные ARFF
Раздел данных состоит из значений, разделенных запятыми, и очень похож на CSV-файл без заголовков столбцов.
@DATA 5.1,3.5,1.4,0.2,0
Дополнительные сведения об этом формате файлов см. на вики-странице weka: ARFF (версия для разработчиков).
Текущая версия ARFF
Машинное обучение Studio (классическая модель) сохраняет файлы ARFF, используя формат ARFF 3,0.
Ожидаемые входные данные
Имя | Тип | Описание |
---|---|---|
Dataset | Таблица данных | Входной набор данных |
Выходные данные
Имя | Тип | Описание |
---|---|---|
Набор данных результатов | Arff | Выходной набор данных |
См. также раздел
Преобразование формата данных
Список модулей в алфавитном порядке