Transformieren von Daten mit Spark in Azure Synapse Analytics

Modul
7 Einheiten

Fortgeschrittene Anfänger

Datentechniker

Azure Synapse Analytics

Technische Fachkräfte für Daten müssen in der Regel große Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, mit der sie dieses Ziel erreichen können.

Lernziele

Dieses Modul umfasst Folgendes:

Verwenden von Apache Spark zum Ändern und Speichern von Dataframes
Partitionieren von Datendateien zur Verbesserung der Leistung und Skalierbarkeit
Transformieren von Daten mit SQL

Voraussetzungen

Bevor Sie dieses Modul absolvieren, sollten Sie sich mit Apache Spark-Pools in Azure Synapse Analytics vertraut machen. Erwägen Sie, zunächst das Modul Analysieren von Daten mit Apache Spark in Azure Synapse Analytics zu absolvieren.

Einführung min
Ändern und Speichern von Dataframes min
Partitionieren von Datendateien min
Transformieren von Daten mit SQL min
Übung: Transformieren von Daten mit Spark in Azure Synapse Analytics min
Wissensbeurteilung min
Zusammenfassung min