Обучение модели кластеризации
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Обучает модели кластеризации и назначает данные из обучающего набора кластерам
категория: Машинное обучение/обучение
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Обзор модуля
в этой статье описывается использование модуля обучение модели кластеризации в Машинное обучение Studio (классическая модель) для обучения модели кластеризации.
Этот модуль принимает несмоделированную модель кластеризации, которая уже настроена с помощью модуля кластеризации K-средних, и обучает модель с помощью помеченного или непомеченного набора данных. Модуль создает как обученную модель, которую можно использовать для прогнозирования, так и набор назначений кластеров для каждого варианта в обучающих данных.
Примечание
Модель кластеризации не может быть обучена с помощью модуля обучение модели , который является универсальным модулем для создания моделей машинного обучения. Это связано с тем, что Обучение модели работает только с защищенными алгоритмами обучения. K-средние и другие алгоритмы кластеризации допускают неконтролируемое обучение. Это означает, что алгоритм может изучать непомеченные данные.
Как использовать Обучение модели кластеризации
Добавьте модуль обучение модели кластеризации в эксперимент в студии (классическая модель). Этот модуль можно найти в разделе Модули машинного обучения (Machine Learning Modules) в категории обучение (Train) .
Добавьте модуль Кластеризация K-средних (K-Means Clustering) или другой настраиваемый модуль, который создает совместимую модель кластеризации, и задайте параметры модели кластеризации.
Прикрепите набор данных для обучения к правому вводу параметра Обучение модели кластеризации (Train Clustering Model) .
В наборе столбцов (Column Set) выберите столбцы из набора данных для использования при построении кластеров. Не забудьте выбрать столбцы, которые являются хорошими компонентами: например, не используйте идентификаторы или другие столбцы, имеющие уникальные значения, или столбцы с одинаковыми значениями.
Если метка доступна, можно использовать ее как компонент или оставить ее.
Выберите параметр проверять только добавление или снять флажок только для результатов, если требуется выводить обучающие данные вместе с новой меткой кластера.
Если отменить выбор этого параметра, будут выводиться только назначения кластера.
Запустите эксперимент или щелкните модуль обучение модели кластеризации и выберите Выполнить выбранное.
Результаты
После завершения обучения:
Чтобы просмотреть кластер и их разделение в графе, щелкните правой кнопкой мыши выходные данные результирующего набора данных и выберите команду визуализировать.
Граф представляет основные компоненты кластера, а не фактические значения. Дополнительные сведения см. в разделе анализ основных компонентов .
Чтобы просмотреть значения в наборе данных, добавьте экземпляр модуля Convert to DataSet и подключите его к выходным данным результирующего набора данных . Запустите модуль Convert to DataSet (преобразовать в набор данных ), чтобы получить копию данных, которые можно просмотреть или скачать.
Чтобы сохранить обученную модель для последующего повторного использования, щелкните модуль правой кнопкой мыши, выберите обученная модельи нажмите кнопку Сохранить как обученную модель.
Чтобы создать оценки на основе модели, используйте назначение данных кластерам (Assign Data to Clusters).
Примеры
Пример использования кластеризации в машинном обучении см. в Коллекция решений ии Azure:
Кластеризация. Поиск схожих компаний: демонстрируется использование кластеризации для атрибутов, производных от неструктурированного текста.
Кластеризация: Color дискретизация: демонстрируется использование кластеризации для поиска связанных цветов и уменьшения числа битов, используемых в образах.
Кластеризация: группирование данных диафрагмы. простой пример кластеризации на основе набора данных IRI.
Ожидаемые входные данные
Имя | Тип | Описание |
---|---|---|
Необученная модель | Интерфейс ICluster | Необученная модель кластеризации |
Dataset | Таблица данных | Источник входных данных |
Параметры модуля
Имя | Диапазон | Тип | По умолчанию | Описание |
---|---|---|---|---|
Набор столбцов | any | Выбор столбцов | Шаблон выбора столбцов | |
Установите флажок для добавления входных данных или снимите флажок для вывода только результатов | any | Логическое | Да | Определяет, должен ли набор данных на выходе содержать входной набор данных с добавлением столбца назначений (флажок установлен) или только столбец назначений (флажок снят) |
Выходные данные
Имя | Тип | Описание |
---|---|---|
Обученная модель | Интерфейс ICluster | Обученная модель кластеризации |
Набор данных результатов | Таблица данных | Входной набор данных с добавлением столбца назначений или только столбец назначений |
Исключения
Исключение | Описание |
---|---|
Ошибка 0003 | Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты. |
список ошибок, относящихся к модулям студии (классическая версия), см. в разделе Машинное обучение коды ошибок.
список исключений API см. в разделе Машинное обучение REST API коды ошибок.
См. также раздел
Список модулей в алфавитном порядке
Обучение
Назначение данных в кластеры
Кластеризация методом K-средних