Поделиться через


Преобразование в ARFF

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Преобразует входные данные в формат файла связи атрибутов, который используется инструментарием Weka.

Категория: преобразования форматов данных

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается, как использовать модуль convert to ARFF в Машинное обучение Studio (классическая модель) для преобразования наборов данных и результатов в формат файла связи атрибутов, используемый набором инструментов Weka. Этот формат известен как ARFF.

Спецификация данных ARFF для weka поддерживает несколько задач машинного обучения, включая предварительную обработку данных, классификацию и выбор компонентов. В этом формате данные упорядочены по показателями и их атрибутам и содержатся в одном текстовом файле. Подробные сведения о формате файла weka можно найти в разделе Технические примечания .

как правило, преобразование в формат файла Weka требуется только в том случае, если вы хотите использовать как Машинное обучение, так и Weka и хотите перемещать обучающие данные между ними.

Дополнительные сведения о наборе инструментов weka см. в статье Википедии: weka (машинное обучение) .

Предупреждение

Невозможно перезаписать существующий файл ARFF в службу хранилища Azure.

Использование Convert to ARFF

  1. Добавьте модуль Convert to ARFF в свой эксперимент. этот модуль можно найти в категории преобразования форматов данных в Машинное обучение Studio (классическая модель).

  2. Подключите его к любому модулю, который выводит набор данных.

  3. Запустите эксперимент или выберите модуль преобразовать в ARFF и нажмите кнопку Выполнить выбранное.

Результаты

  • Чтобы создать копию данных в локальной папке, дважды щелкните выходные данные Convert to ARFFи выберите параметр Download (загрузить ).

    Если папка не указана, применяется имя файла по умолчанию и файл сохраняется в локальной библиотеке загрузок .

Примечание

Этот модуль не поддерживает экспорт в код Python или R.

Примеры

В Коллекция решений ии Azureнет примеров, относящихся к этому формату. Однако эти эксперименты демонстрируют другие типы преобразования форматов:

Технические примечания

В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.

Пример формата ARFF

В этом разделе приведен пример того, как типичный набор данных будет выглядеть при преобразовании в ARFF.

Обычно файл данных ARFF состоит из двух разделов: заголовка , определяющего источник данных и схему, и раздела данных , содержащего фактические сущности и их атрибуты.

Заголовок ARFF

Заголовок для файла ARFF определяет список атрибутов (в столбцах) и их типы данных. Заголовок также может содержать несколько строк комментариев, описывающих источник данных, или другие примечания.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Совет

Если в преобразуемом наборе данных отсутствуют имена столбцов, используйте модуль изменение метаданных для добавления имен столбцов перед использованием преобразования в ARFF.

Данные ARFF

Раздел данных состоит из значений, разделенных запятыми, и очень похож на CSV-файл без заголовков столбцов.

@DATA 5.1,3.5,1.4,0.2,0

Дополнительные сведения об этом формате файлов см. на вики-странице weka: ARFF (версия для разработчиков).

Текущая версия ARFF

Машинное обучение Studio (классическая модель) сохраняет файлы ARFF, используя формат ARFF 3,0.

Ожидаемые входные данные

Имя Тип Описание
Dataset Таблица данных Входной набор данных

Выходные данные

Имя Тип Описание
Набор данных результатов Arff Выходной набор данных

См. также раздел

Преобразование формата данных
Список модулей в алфавитном порядке