Использование Apache Spark MLlib в Azure Databricks
На этой странице приведены примеры записных книжек, показывающих, как использовать MLlib в Azure Databricks.
Apache Spark MLlib — масштабируемая библиотека машинного обучения Apache Spark, состоящая из общих алгоритмов и служебных программ обучения, включая классификацию, регрессию, кластеризацию, совместную фильтрацию, сокращение размерности, а также базовые элементы оптимизации. Для получения справочных сведений о функциях MLlib Azure Databricks рекомендует следующие ссылки на API Apache Spark:
Сведения об использовании Apache Spark MLlib из R см. в документации по машинному обучению R.
Пример записной книжки для двоичной классификации
В этой записной книжке показано, как создать приложение двоичной классификации с помощью API конвейеров Apache Spark MLlib.
Записная книжка — двоичная классификация
Примеры записных книжек для деревьев принятия решений
В этих примерах демонстрируются разные приложения деревьев принятия решений с использованием API конвейеров Apache Spark MLlib.
деревья принятия решений
В этих записных книжках показано, как выполнять классификацию с помощью деревьев принятия решений.
Записная книжка — деревья принятия решений для распознавания цифр
Записная книжка — деревья принятия решений для опроса SFO
Регрессия GBT с использованием конвейеров MLlib
В этой записной книжке показано, как использовать конвейеры MLlib для выполнения регрессии с использованием деревьев с градиентным бустингом для прогнозирования показателей проката велосипедов (в час) на основе таких сведений, как день недели, погода, сезон и т. д.
Записная книжка — регрессия для прогнозирования показателей проката велосипедов
Пример расширенной записной книжки Apache Spark MLlib
В этой записной книжке показано, как создать пользовательский трансформатор.