Implementieren einer Lösung für maschinelles Lernen mit Azure Databricks

Fortgeschrittene Anfänger
Data Scientist
Azure Databricks

Azure Databricks ist eine Plattform im Cloudmaßstab für Datenanalyse und Machine Learning. Data Scientists und Machine Learning-Engineers können Azure Databricks verwenden, um Machine-Learning-Lösungen im großen Stil zu implementieren.

Voraussetzungen

In diesem Lernpfad wird davon ausgegangen, dass Sie über Erfahrung im Umgang mit Python für die Untersuchung von Daten verfügen und damit vertraut sind, Machine Learning-Modelle mit gängigen Open-Source-Frameworks wie Scikit-Learn, PyTorch und TensorFlow zu trainieren. Ziehen Sie in Erwägung, den Lernpfad Erstellen von Machine Learning-Modellen zu absolvieren, bevor Sie den vorliegenden Lernpfad bearbeiten.

Module in diesem Lernpfad

Azure Databricks ist ein Clouddienst, der eine skalierbare Plattform für Datenanalysen mit Apache Spark bereitstellt.

Azure Databricks basiert auf Apache Spark und ermöglicht es Datentechniken und -Analysten, Spark-Aufträge auszuführen, um Datenmengen im großen Stil zu transformieren, zu analysieren und zu visualisieren.

Das maschinelle Lernen umfasst die Verwendung von Daten zum Trainieren eines Vorhersagemodells. Azure Databricks unterstützt mehrere häufig verwendete Machine Learning-Frameworks, die Sie zum Trainieren von Modellen verwenden können.

MLflow ist eine Open Source Plattform zum Verwalten des Machine Learning-Lebenszyklus, die in Azure Databricks nativ unterstützt wird.

Die Optimierung von Hyperparametern ist ein wesentlicher Bestandteil des maschinellen Lernens. In Azure Databricks können Sie die Hyperopt-Bibliothek verwenden, um Hyperparameter automatisch zu optimieren.

AutoML in Azure Databricks vereinfacht den Prozess zur Erstellung eines effizienten Machine Learning-Modells für Ihre Daten.

Deep Learning verwendet neuronale Netze, um hocheffektive Machine Learning-Modelle für komplexe Vorhersagen, maschinelles Sehen, linguistische Datenverarbeitung und andere KI-Workloads zu trainieren.

Maschinelles Lernen ermöglicht eine datengesteuerte Entscheidungsfindung und Automatisierung, das Bereitstellen von Modellen in der Produktion, um in Echtzeit Erkenntnisse zu gewinnen, ist jedoch eine Herausforderung. Azure Databricks stellt eine einheitliche Plattform zum Erstellen, Trainieren und Bereitstellen von Machine Learning-Modellen im großen Stil bereit, die die Zusammenarbeit zwischen wissenschaftlichen und technischen Fachkräften für Daten fördert und diesen Prozess vereinfacht.