Processi di governance dei dati
Esistono quattro categorie di processi di governance dei dati.
Categoria di processo | Processi |
---|---|
processi di scoperta dei dati per comprendere il paesaggio dei dati | Processo di individuazione, mappatura e catalogazione di dati ed entità di dati Processo di profilazione dei dati per determinare la qualità dei dati Processo di scoperta e classificazione per la governance dei dati sensibili Un processo di individuazione per la manutenzione dei dati nell'ambito dell'analisi CRUD, come ad esempio dai file di log, per comprendere l'utilizzo e la manutenzione dei dati, come i dati principali, in tutta l'azienda. |
processi di definizione della governance dei dati | Creare e gestire un vocabolario aziendale comune in un glossario aziendale definiscono le entità dati, inclusi i dati master, i nomi degli attributi di dati, le regole di integrità dei dati e i formati validi Definire i dati di riferimento per standardizzare i set di codice nell'organizzazione Definire schemi di classificazione della governance dei dati per etichettare i dati per determinare come controllarli Definire criteri e regole di governance dei dati per gestire l'entità dati e i cicli di vita dei documenti Definire le metriche di successo e la soglia |
criteri di governance dei dati e processi di imposizione delle regole | Processo per automatizzare l'applicazione e l'imposizione delle politiche e delle regole di governance dei dati Processo per applicare e far rispettare manualmente criteri e regole Processi di governance dei dati basati su eventi, su richiesta e basati su timer (batch) pubblicati come servizi che possono essere richiamati per gestire: Inserimento dati: catalogazione, classificazione, assegnazione del proprietario e archiviazione Qualità dei dati Sicurezza dell'accesso ai dati Privacy dei dati Utilizzo dei dati, ad esempio, inclusa la condivisione e per garantire che i dati concessi in licenza vengano usati solo per scopi approvati Manutenzione dei dati, ad esempio dati master Conservazione dei dati Sincronizzazione dei dati master e dei dati di riferimento |
i processi di monitoraggio | Monitorare e controllare l'attività di utilizzo dei dati, la qualità dei dati, la sicurezza dell'accesso ai dati, la privacy dei dati, la manutenzione dei dati e la conservazione dei dati Monitorare il rilevamento e la risoluzione delle violazioni dei criteri |
Il vocabolario aziendale comune deve essere definito in un glossario aziendale all'interno di un catalogo dati.
I gruppi di lavoro di governance dei dati pianificano e sviluppano definendo i dati e migliorando domini dati specifici (ad esempio, cliente o fornitore); aggiornano il comitato di controllo della governance dei dati sul progresso; e gestiscono la responsabilità nell'intera azienda per un dominio specifico. Ogni gruppo di lavoro deve assumere la responsabilità di definire un'entità dati o un'area dell'interessato specifica, ad esempio più entità correlate. Più entità di dati nel vocabolario, insieme alle politiche e alle regole, possono quindi essere elaborate in parallelo. Per informazioni, vedere Ruoli e responsabilità di governance dei dati
Figura 1: Gruppo di lavoro di governance dei dati di esempio
L'integrazione del glossario aziendale del catalogo con altre tecnologie è quindi necessaria per ottenere nomi di dati comuni coerenti in tutte le tecnologie. Esempi di altre tecnologie da integrare con includono:
- Strumenti ETL (estrazione, trasformazione, caricamento)
- Strumenti di modellazione dei dati
- Strumenti bi, sistemi di gestione dei database
- Gestione dei dati master
- Strumenti di virtualizzazione dei dati
- Strumenti di sviluppo software
Una procedura consigliata per la creazione di un vocabolario aziendale comune consiste nel sviluppare un modello di concetto di dati. Questo modello usa un approccio dall'alto verso il basso per identificare i concetti dei dati che possono essere usati come entità dati in un vocabolario aziendale comune. È quindi possibile assegnare gruppi di lavoro di governance dei dati diversi a ogni concetto di dati (entità) o a un gruppo di concetti relativi ai dati (area di interesse). Questi gruppi di lavoro sono responsabili della governance di diverse entità di dati nell'intero contesto.
Quando si crea un vocabolario aziendale comune, è possibile usare il software del catalogo dati per individuare automaticamente quali dati esistono in più archivi dati. Questo software consente di identificare tutti gli attributi associati a entità di dati specifiche, ovvero un approccio di fondo verso l'alto.
Più gruppi di lavoro possono costruire in modo incrementale un vocabolario aziendale comune, combinando rapidamente l'approccio top-down di un modello concettuale dei dati con l'approccio dal basso dell'individuazione automatica dei dati.
L'uso di un catalogo dati per l'individuazione automatica dei dati consente la mappatura di dati diversi a un vocabolario comune. Il catalogo dati consente di comprendere dove si trovano i dati per ogni particolare entità dati nel glossario aziendale in tutta l'azienda.
Criteri e regole per gestire i dati in punti diversi del ciclo di vita
I criteri di governance dei dati descrivono un set di regole per controllare l'integrità, la qualità, la sicurezza dell'accesso, la privacy e la conservazione dei dati. Esistono diversi tipi di politiche che includono:
- Criteri di integrità dei dati, ad esempio valori validi, integrità referenziale.
- Criteri di qualità dei dati con regole di standardizzazione, pulizia e corrispondenza dei dati.
- Criteri di protezione dei dati con regole di sicurezza e privacy dei dati di accesso.
- Criteri di conservazione dei dati per gestire il ciclo di vita con regole di conservazione, archiviazione e backup. Potrebbero essere necessarie più versioni di un criterio per gestire gli stessi dati in giurisdizioni legali diverse.
Lo schema di classificazione della riservatezza dei dati ha cinque livelli di classificazione:
- Pubblico
- Solo uso interno
- Confidenziale
- Dati personali sensibili
- Limitato
Gestire i dati combinando questo schema di classificazione con criteri e regole. Usare ognuno dei cinque livelli per etichettare i dati, ad esempio i dati personali sensibili. Creando regole per i dati personali sensibili e collegando queste regole a un criterio, si creano criteri per i dati personali sensibili. È possibile associare la politica all'etichetta dei dati personali sensibili e quindi allegare quest'ultima ai dati. In questo modo, tutti i dati etichettati come dati personali sensibili sono soggetti agli stessi criteri e regole. Questo processo è noto come gestione dei criteri basata su tag . È flessibile perché una singola regola o un criterio può essere modificata in modo indipendente. Tutti i dati sensibili etichettati sono regolati dalle nuove regole. Allo stesso modo, un'etichetta di dati personali sensibili può essere scollegata dai dati e un'etichetta riservata utilizzata. In questo caso, i dati diventano immediatamente regolati da un nuovo set di criteri e regole associati all'etichetta riservata.
Dopo aver definito criteri e regole in un catalogo dati per ogni classe in uno schema di classificazione della governance dei dati, possono essere passati ad altre tecnologie da un catalogo dati, tramite API, per applicarle. In alternativa, una piattaforma di gestione dei dati comune in grado di connettersi a più archivi dati potrebbe potenzialmente applicarle.
Dovrebbe quindi essere possibile monitorare la qualità dei dati, la privacy, la sicurezza dell'accesso, l'utilizzo, la manutenzione e la conservazione di entità dati specifiche nel corso del ciclo di vita.