Introduzione

Completato

Si consideri lo scenario in cui dopo aver importato dati in Power BI da diverse origini, esaminando i dati ci si rende conto che non sono preparati per l'analisi. Cosa potrebbe rendere i dati non preparati per l'analisi?

Quando si esaminano i dati, vengono individuati diversi problemi, tra cui:

  • Una colonna denominata Employment status contiene solo numeri.

  • Diverse colonne contengono errori.

  • Alcune colonne contengono valori Null.

  • L'ID cliente in alcune colonne viene visualizzato come se fosse duplicato ripetutamente.

  • Una singola colonna per l'indirizzo include dati combinati di nome e numero di via, città, stato e codice postale.

Si iniziano a usare i dati, ma ogni volta che si creano oggetti visivi nei report, si ottengono dati non validi, risultati non corretti e semplici report sui totali delle vendite risultano errati.

I dati dirty possono essere travolgenti e, anche se si potrebbe sentirsi frustrati, si decide di lavorare e capire come rendere questo modello semantico il più pulito possibile.

Fortunatamente, Power BI e Power Query offrono un ambiente potente per pulire e preparare i dati. I vantaggi dei dati puliti sono i seguenti:

  • Le misure e le colonne producono risultati più accurati quando eseguono aggregazioni e calcoli.

  • Le tabelle sono organizzate e gli utenti possono trovare i dati in modo intuitivo.

  • I duplicati vengono rimossi, semplificando l'esplorazione dei dati. Verranno anche generate colonne che possono essere usate in filtri dei dati e filtri.

  • Una colonna complessa può essere suddivisa in due colonne più semplici. È possibile combinare più colonne in una sola per migliorare la leggibilità.

  • I codici e i numeri interi possono essere sostituiti con valori leggibili.

Contenuto del modulo:

  • Risolvere le incoerenze, i valori imprevisti o Null e i problemi relativi alla qualità dei dati.

  • Applicare sostituzioni di valori descrittivi.

  • Profilare i dati in modo da poter ottenere ulteriori informazioni su una colonna specifica prima di usarla.

  • Valutare e trasformare i tipi di dati delle colonne.

  • Applicare trasformazioni della forma dei dati alle strutture della tabella.

  • Combinare query.

  • Applicare convenzioni di denominazione semplici a colonne e query.

  • Modificare il codice M nell'editor avanzato.