Leggere i file Parquet con Azure Databricks
Questo articolo illustra come leggere i dati dai file Apache Parquet usando Azure Databricks.
Che cos'è Parquet?
Apache Parquet è un formato di file a colonne con ottimizzazioni che velocizzano le query. Si tratta di un formato di file più efficiente rispetto a CSV o JSON.
Per altre informazioni, vedere File Parquet.
Opzioni
Vedere gli articoli di riferimento di Apache Spark seguenti per le opzioni di lettura e scrittura supportate.
Esempio di notebook: Lettura e scrittura in file Parquet
Il notebook seguente illustra come leggere e scrivere dati in file Parquet.