Поделиться через


Модули кластеризации

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

в этой статье описываются модули в Машинное обучение Studio (классическая модель), которые поддерживают создание моделей кластеризации.

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Что такое кластеризация?

Кластеризация в машинном обучении — это метод группирования точек данных в похожие кластеры. Он также называется сегментацией.

За годы были разработаны многие алгоритмы кластеризации. Почти все алгоритмы кластеризации используют функции отдельных элементов для поиска похожих элементов. Например, можно применить кластеризацию, чтобы найти похожих людей по демографическим показателям. Кластеризацию можно использовать с анализом текста для группирования предложений с похожими темами или тональности.

Кластеризация называется методом неконтролируемого обучения, так как он может использоваться в непомеченных данных. В действительности Кластеризация — это полезный первый шаг для обнаружения новых шаблонов и требует небольших знаний о том, как могут быть структурированы данные или как связаны элементы. Кластеризация часто используется для исследования данных перед анализом с помощью других прогнозных алгоритмов.

Создание модели кластеризации

в Машинное обучение Studio (классическая модель) можно использовать кластеризацию с помеченными или непомеченными данными.

  • В непомеченных данных алгоритм кластеризации определяет, какие точки данных близки друг к другу, и создает кластеры вокруг центральной точки или центроид. Затем можно использовать идентификатор кластера в качестве временной метки для группы данных.

  • Если данные имеют метки, можно использовать метку для управления количеством кластеров или использовать метку в качестве другой функции.

После настройки алгоритма кластеризации вы обучите данные с помощью модели обучения или модулей кластеризации очистки .

При обучении модели используйте ее для прогнозирования членства в кластере для новых точек данных. Например, если вы использовали кластеризацию для группировки клиентов по поведению покупки, модель можно использовать для прогнозирования поведения новых клиентов в процессе покупки.

Список модулей

Категория кластеризации включает этот модуль:

Чтобы использовать другой алгоритм кластеризации или создать настраиваемую модель кластеризации с помощью R, см. следующие разделы:

Примеры

Примеры кластеризации в действии см. в Коллекция решений ии Azure.

Сведения о выборе алгоритма см. в следующих статьях:

См. также раздел