Поделиться через


Databricks Runtime 4.1 ML (EoS)

Примечание.

Поддержка этой версии databricks Runtime закончилась. Сведения о дате окончания поддержки см . в журнале завершения поддержки. Все поддерживаемые версии среды выполнения Databricks см. в заметках о выпуске Databricks Runtime и совместимости.

Databricks Runtime 4.1 ML предоставляет готовую среду для Машинного обучения и обработки и анализа данных. Она содержит много популярных библиотек, включая TensorFlow, Keras и XGBoost. Она также поддерживает распределенное обучение TensorFlow с использованием Horovod.

Примечание.

Этот выпуск устарел до 17 января 2019 г. Мы рекомендуем использовать более новую версию Databricks Runtime ML с учетом того, какие версии библиотек вы хотите использовать.

Дополнительные сведения, включая инструкции по созданию кластера Databricks Runtime ML, см. в статье ИИ и машинное обучение в Databricks.

Примечание.

Выпуски Databricks Runtime ML получают все сервисные обновления базового выпуска Databricks Runtime. Список всех обновлений обслуживания см. в разделе "Обновления обслуживания" для среды выполнения Databricks (архивировано).

Библиотеки

В основе Databricks Runtime 4.1 ML лежит Databricks Runtime 4.1. Дополнительные сведения о новых возможностях Databricks Runtime 4.1 см. в заметках о выпуске Databricks Runtime 4.1 (EoS). Помимо обновлений библиотек, существовавших в Databricks Runtime 4.1, в Databricks Runtime 4.1 ML также добавлены новые библиотеки для поддержки машинного обучения. Некоторые из них также включены в базовый выпуск Databricks Runtime 4.1, что будет отдельно отмечено.

Категория Библиотеки
Распределенное глубокое обучение. Распределенное обучение с использованием Horovod и Spark

- HorovodEstimator
- Horovod 0.12.1
- openmpi 3.0.0
- paramiko 2.4.1
— cloudpickle 0.5.2

Распределенный прогноз TensorFlow и Keras:

— предварительная версия spark-deep-learning 1.0
- tensorframes 0.3.0
Глубокое обучение [Keras]:

— keras 2.1.5
- h5py 2.7.1

TensorFlow.

- (кластеры ЦП) tensorflow 1.7.1
- (кластеры GPU) tensorflow-gpu 1.7.1

Библиотеки GPU:

— CUDA 9.0 (также установлен в базовой среде выполнения Databricks)
— cuDNN 7.0 (также установлен в базовой среде выполнения Databricks)
- NCCL 2.0.5-3
XGBoost - XGBoost4j 0.8-spark2.3-s_2.11
Другие библиотеки машинного обучения - numpy 1.14.2 (также устанавливается в базовый выпуск Databricks Runtime; версия может отличаться)
- scikit-learn 0.18.1 (также устанавливается в базовый выпуск Databricks Runtime)
- scipy (также устанавливается в базовый выпуск Databricks Runtime)