Introduzione
Si consideri lo scenario in cui dopo aver importato dati in Power BI da diverse origini, esaminando i dati ci si rende conto che non sono preparati per l'analisi. Cosa potrebbe rendere i dati non preparati per l'analisi?
Quando si esaminano i dati, vengono individuati diversi problemi, tra cui:
Una colonna denominata Employment status contiene solo numeri.
Diverse colonne contengono errori.
Alcune colonne contengono valori Null.
L'ID cliente in alcune colonne viene visualizzato come se fosse duplicato ripetutamente.
Una singola colonna per l'indirizzo include dati combinati di nome e numero di via, città, stato e codice postale.
Si iniziano a usare i dati, ma ogni volta che si creano oggetti visivi nei report, si ottengono dati non validi, risultati non corretti e semplici report sui totali delle vendite risultano errati.
I dati dirty possono essere travolgenti e, anche se si potrebbe sentirsi frustrati, si decide di lavorare e capire come rendere questo modello semantico il più pulito possibile.
Fortunatamente, Power BI e Power Query offrono un ambiente potente per pulire e preparare i dati. I vantaggi dei dati puliti sono i seguenti:
Le misure e le colonne producono risultati più accurati quando eseguono aggregazioni e calcoli.
Le tabelle sono organizzate e gli utenti possono trovare i dati in modo intuitivo.
I duplicati vengono rimossi, semplificando l'esplorazione dei dati. Verranno anche generate colonne che possono essere usate in filtri dei dati e filtri.
Una colonna complessa può essere suddivisa in due colonne più semplici. È possibile combinare più colonne in una sola per migliorare la leggibilità.
I codici e i numeri interi possono essere sostituiti con valori leggibili.
Contenuto del modulo:
Risolvere le incoerenze, i valori imprevisti o Null e i problemi relativi alla qualità dei dati.
Applicare sostituzioni di valori descrittivi.
Profilare i dati in modo da poter ottenere ulteriori informazioni su una colonna specifica prima di usarla.
Valutare e trasformare i tipi di dati delle colonne.
Applicare trasformazioni della forma dei dati alle strutture della tabella.
Combinare query.
Applicare convenzioni di denominazione semplici a colonne e query.
Modificare il codice M nell'editor avanzato.