I Jupyter Notebook di esempio illustrano come arricchire i dati con i set di dati aperti

Articolo
09/03/2024

I Jupyter Notebook di esempio per set di dati aperti di Azure spiegano come caricare set di dati aperti e usarli per arricchire i dati demo. Le tecniche includono l'uso di Apache Spark e Pandas per elaborare i dati.

Importante

Quando si lavora in un ambiente non Spark, set di dati aperti di Azure consente i download per un mese di dati alla volta con determinate classi per evitare errori MemoryError in caso di set di dati di grandi dimensioni.

Caricare dati ISD (Integrated Surface Database) NOAA

Notebook	Descrizione
Caricare un mese di dati meteo recenti in un dataframe Pandas	Informazioni su come caricare dati meteo storici in un dataframe Pandas a scelta.
Caricare un mese di dati meteo recenti in un dataframe Spark	Informazioni su come caricare dati meteo storici in un dataframe Spark a scelta.

Unire dati demo con dati ISD NOAA

Notebook	Descrizione
Unire dati demo con dati meteo - Pandas	Unire un mese di dati demo di un set di dati di posizioni di sensori con le letture meteo di un dataframe Pandas.
Unire dati demo con dati meteo - Spark	Unire un set di dati di posizioni di sensori con le letture meteo di un dataframe Spark.

Unire dati sui taxi di New York con dati ISD NOAA

Notebook	Descrizione
Dati sulle corse dei taxi arricchiti con dati meteo - Pandas	Caricare più di un mese di dati sui taxi verdi di New York e arricchirli con dati meteo in un dataframe Pandas. Questo esempio esegue l'override del metodo `get_pandas_limit` e bilancia le prestazioni del carico di dati con la quantità di dati.
Dati sulle corse dei taxi arricchiti con dati meteo - Spark	Caricare i dati sui taxi verdi di New York e arricchirli con dati meteo in un dataframe Spark.

Condividi tramite

I Jupyter Notebook di esempio illustrano come arricchire i dati con i set di dati aperti

Caricare dati ISD (Integrated Surface Database) NOAA

Unire dati demo con dati ISD NOAA

Unire dati sui taxi di New York con dati ISD NOAA

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive