Come eseguire il profiling dei dati delle origini dati in Azure Data Catalog
Importante
Azure Data Catalog è stato ritirato il 15 maggio 2024.
Per le funzionalità del catalogo dati, usare il servizio Microsoft Purview, che offre una governance dei dati unificata per l'intero patrimonio di dati.
Introduzione
Microsoft Azure Data Catalog è un servizio cloud completamente gestito che funge da sistema di registrazione e di individuazione per origini dati aziendali. In altre parole, il Catalogo dati di Azure consente agli utenti di individuare, comprendere e usare origini dati e aiuta le organizzazioni a ottenere maggior valore dai dati esistenti. Quando un'origine dati viene registrata con Azure Data Catalog, i relativi metadati vengono copiati e indicizzati dal servizio, ma non è tutto.
La funzione di profiling dati di Azure Data Catalog esamina i dati delle origini dati supportate nel catalogo e raccoglie statistiche e informazioni sui dati. È facile includere un profilo degli asset di dati. Quando si registra un asset di dati, scegliere Includi profilo dati nello strumento di registrazione delle origini dati.
Che cos'è il profiling dei dati?
Il profiling dati esamina i dati nell'origine dati di cui è in corso la registrazione e raccoglie statistiche e informazioni sui dati. Durante l'individuazione delle origini dati, le statistiche consentono di determinare l'idoneità dei dati per la risoluzione del problema aziendale.
Le origini dati seguenti supportano il profiling dati:
- Viste e tabelle di SQL Server, inclusi database SQL di Azure e Azure Synapse Analytics.
- Viste e tabelle di Oracle
- Viste e tabelle di Teradata
- Tabelle Hive
Includendo i profili dati durante la registrazione degli asset di dati gli utenti possono rispondere a domande sulle origini dati, ad esempio:
- Può essere usata per risolvere il problema aziendale?
- I dati sono conformi a standard o modelli particolari?
- Quali sono alcune delle anomalie dell'origine dati?
- Quali sono i possibili problemi legati all'integrazione di questi dati nell'applicazione?
Nota
È anche possibile aggiungere della documentazione a un asset per descrivere come integrare i dati in un'applicazione. Vedere l'articolo relativo alla documentazione delle origini dati.
Come includere un profilo dati durante la registrazione di un'origine dati
È facile includere un profilo dell'origine dati. Quando si registra un'origine dati, nel pannello Oggetti da registrare dello strumento di registrazione delle origini dati scegliere Includi profilo dati.
Per altre informazioni su come registrare le origini dati, vedere Come registrare le origini dati e Introduzione ad Azure Data Catalog.
Applicazione di filtri su asset di dati che includono profili dati
Per trovare asset di dati che includono un profilo dati, è possibile specificare has:tableDataProfiles
o has:columnsDataProfiles
come termini di ricerca.
Nota
Selezionando Includi profilo dati nello strumento di registrazione dell'origine dati, è possibile includere le informazioni del profilo a livello di tabella e a livello di colonna. Tuttavia, l'API del catalogo dati consente la registrazione degli asset di dati con un solo set di informazioni sul profilo.
Visualizzazione delle informazioni sul profilo dati
Dopo aver individuato un'origine dati adatta con un profilo, è possibile visualizzare i dettagli relativi al profilo dati. Per visualizzare il profilo dati, selezionare un asset di dati e scegliere Profilo dati nella finestra del portale di Azure Data Catalog.
Un profilo dati in Azure Data Catalog include informazioni sul profilo a livello di tabella e di colonna, ad esempio:
Profilo dati dell'oggetto
- Numero di righe
- Dimensioni della tabella
- Ultimo aggiornamento dell'oggetto
Profilo dati della colonna
- Tipo di dati colonna
- Numero di valori distinct
- Numero di righe con valori NULL
- Deviazione minima, massima, media e standard per i valori di colonna
Riepilogo
Il profiling dati fornisce statistiche e informazioni sugli asset di dati registrati per consentire di determinare l'idoneità dei dati per la risoluzione di problemi aziendali. Oltre che annotare e documentare le origini dati, i profili dati permettono agli utenti di comprendere meglio i dati.