Поделиться через


Использование Apache Spark MLlib в Azure Databricks

На этой странице приведены примеры записных книжек, показывающих, как использовать MLlib в Azure Databricks.

Apache Spark MLlib — масштабируемая библиотека машинного обучения Apache Spark, состоящая из общих алгоритмов и служебных программ обучения, включая классификацию, регрессию, кластеризацию, совместную фильтрацию, сокращение размерности, а также базовые элементы оптимизации. Для получения справочных сведений о функциях MLlib Azure Databricks рекомендует следующие ссылки на API Apache Spark:

Сведения об использовании Apache Spark MLlib из R см. в документации по машинному обучению R.

Пример записной книжки для двоичной классификации

В этой записной книжке показано, как создать приложение двоичной классификации с помощью API конвейеров Apache Spark MLlib.

Записная книжка — двоичная классификация

Получить записную книжку

Примеры записных книжек для деревьев принятия решений

В этих примерах демонстрируются разные приложения деревьев принятия решений с использованием API конвейеров Apache Spark MLlib.

деревья принятия решений

В этих записных книжках показано, как выполнять классификацию с помощью деревьев принятия решений.

Записная книжка — деревья принятия решений для распознавания цифр

Получить записную книжку

Записная книжка — деревья принятия решений для опроса SFO

Получить записную книжку

Регрессия GBT с использованием конвейеров MLlib

В этой записной книжке показано, как использовать конвейеры MLlib для выполнения регрессии с использованием деревьев с градиентным бустингом для прогнозирования показателей проката велосипедов (в час) на основе таких сведений, как день недели, погода, сезон и т. д.

Записная книжка — регрессия для прогнозирования показателей проката велосипедов

Получить записную книжку

Пример расширенной записной книжки Apache Spark MLlib

В этой записной книжке показано, как создать пользовательский трансформатор.

Записная книжка — пользовательский трансформатор

Получить записную книжку