Lesen von Parquet-Dateien mit Azure Databricks

Artikel
12/17/2024

Dieser Artikel erklärt, wie Sie Daten aus Parquet-Dateien mithilfe von Azure Databricks lesen.

Was ist Parquet?

Apache Parquet ist ein spaltenbasiertes Dateiformat mit Optimierungen zur Beschleunigung von Abfragen. Dieses Dateiformat ist effizienter als CSV oder JSON.

Weitere Informationen finden Sie unter Parquet-Dateien.

Optionen

Die unterstützten Optionen für Lesen und Schreiben finden Sie in den folgenden Apache Spark-Referenzartikeln.

Lesen
- Python
- Scala
Schreiben
- Python
- Scala

Notebookbeispiel: Lesen und Schreiben in Parquet-Dateien

Im folgenden Notebook wird gezeigt, wie Sie Daten in Parquet-Dateien lesen und schreiben können.

Notebook zum Lesen von Parquet-Dateien

Notebook abrufen

Freigeben über

Lesen von Parquet-Dateien mit Azure Databricks

Was ist Parquet?

Optionen

Notebookbeispiel: Lesen und Schreiben in Parquet-Dateien

Notebook zum Lesen von Parquet-Dateien

Feedback

Zusätzliche Ressourcen