Leggere i file Parquet con Azure Databricks
Questo articolo illustra come leggere i dati dai file Apache Parquet usando Azure Databricks.
Che cos'è Parquet?
Apache Parquet è un formato di file a colonne con ottimizzazioni che velocizzano le query. Si tratta di un formato di file più efficiente rispetto a CSV o JSON.
Per altre informazioni, vedere File Parquet.
Opzioni
Per le opzioni di lettura e scrittura supportate, vedere gli articoli di riferimento di Apache Spark seguenti.
Notebook di esempio: Lettura e scrittura di file Parquet
Il notebook seguente illustra come leggere e scrivere dati in file Parquet.