Transformieren von Daten mit Spark in Azure Synapse Analytics
Technische Fachkräfte für Daten müssen in der Regel große Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, mit der sie dieses Ziel erreichen können.
Lernziele
Dieses Modul umfasst Folgendes:
- Verwenden von Apache Spark zum Ändern und Speichern von Dataframes
- Partitionieren von Datendateien zur Verbesserung der Leistung und Skalierbarkeit
- Transformieren von Daten mit SQL
Voraussetzungen
Bevor Sie dieses Modul absolvieren, sollten Sie sich mit Apache Spark-Pools in Azure Synapse Analytics vertraut machen. Erwägen Sie, zunächst das Modul Analysieren von Daten mit Apache Spark in Azure Synapse Analytics zu absolvieren.