Requisiti per la governance dei dati
L'analisi su scala cloud consiglia di considerare i requisiti seguenti per la governance dei dati:
- Definizione di entità dati per creare un vocabolario aziendale comune in un glossario aziendale. Le entità di dati in questo contesto indicano concetti come cliente, fornitore, materiali, dipendenti e altri.
- Identificazione e individuazione di entità dati.
- Classificazione dei dati per gestire la sicurezza dell'accesso ai dati, la privacy dei dati e la conservazione dei dati.
- Persone, ad esempio i proprietari dei dati con responsabilità di governance e amministratori dei dati responsabili della protezione e della qualità dei dati.
- Processi di governance dei dati.
- Gestione del ciclo di vita dei dati per stabilire per quanto tempo devono essere conservati i dati.
- Criteri e regole per definire le modalità di governance di dati specifici per l'intero ciclo di vita.
- Applicazione dei criteri su tutti gli archivi dati nel panorama dei dati distribuiti.
- Gestione dei dati master per rendere i dati coerenti tra sistemi operativi e analitici come cliente, prodotto e fornitore.
- Derivazione dei metadati per comprendere la trasformazione e la relazione delle entità di dati.
- La tecnologia consente di gestire dati strutturati, multistrutturati e non strutturati. La governance può estendersi al data center, su più cloud e al perimetro.
Una sfida è che i dati vengono raccolti e archiviati in più posizioni nell'intera azienda. I dati possono includere i dati raccolti e archiviati in aree geografiche diverse e giurisdizioni legali diverse. Di conseguenza, potrebbero essere applicate normative diverse per la governance degli stessi dati in giurisdizioni diverse. Individuare i dati distribuiti su più cloud e in diverse posizioni geografiche per:
- Comprendere quali attributi di dati, entità di dati e relazioni tra i dati esistono nel panorama dei dati distribuiti.
- Classificare i dati per sapere come controllarli.
- Definire i criteri per specificare come devono essere regolati i dati per ogni tipo di classificazione dei dati e gestione del ciclo di vita.
- Applicare criteri di qualità dei dati, sicurezza dell'accesso ai dati, privacy dei dati e gestione del ciclo di vita nel panorama dei dati distribuiti.
Classificazione dei dati
La classificazione dei dati è un modo per classificare gli asset di dati assegnando tag logici o classi univoci agli asset di dati. La classificazione si basa sul contesto aziendale dei dati.
È necessario un modo per classificare i dati per capire il livello di riservatezza e per quanto tempo mantenerli. La classificazione richiede:
- Schema di classificazione della riservatezza dei dati.
- Schema di classificazione della conservazione dei dati.
Schema di classificazione della riservatezza dei dati
Classificazione | Descrizione |
---|---|
Pubblico | Chiunque può accedere ai dati e può essere inviato a chiunque. Ad esempio, aprire i dati per enti pubblici. |
Solo per uso interno. | Solo i dipendenti possono accedere ai dati e non possono essere inviati all'esterno dell'azienda. |
Riservati | I dati possono essere condivisi solo se sono necessari per un'attività specifica. I dati non possono essere inviati all'esterno dell'azienda senza un accordo di non divulgazione. |
Sensibili (dati personali) | I dati contengono informazioni private, che devono essere mascherate e condivise solo per un periodo di tempo limitato. I dati non possono essere inviati a personale non autorizzato o all'esterno dell'azienda. |
Limitata | I dati possono essere condivisi solo con persone denominate che sono responsabili della protezione. Ad esempio, documenti legali o segreti commerciali. |
Schema di classificazione della conservazione del ciclo di vita dei dati
Conservazione | Descrizione |
---|---|
Nessuna | I dati possono essere eliminati in qualsiasi momento. |
Temporanea | Conservare i dati per un breve periodo di tempo. Ad esempio, mantenere i dati di Twitter per una settimana. |
Periodo fisso | Conservare i dati per un numero di anni impostato, dopo il quale è possibile eliminarli. Ad esempio, conservare i registri fiscali per sette anni per rispettare le leggi governative. |
Permanente | Non eliminare mai i dati. Ad esempio, corrispondenza legale. |
Per etichettare in modo coerente i dati nel panorama dei dati distribuiti, è necessario automatizzare il processo di classificazione della riservatezza dei dati e del ciclo di vita dei dati usando le classi definite in ogni schema. L'automazione consente di essere regolati in modo coerente e corretto. Definire quindi regole e criteri per ogni classe nello schema di classificazione per specificare come gestire la governance dei dati in base alla relativa classificazione.
Ruoli e responsabilità per la governance dei dati
Un altro requisito è la necessità di definire le responsabilità. In caso contrario, la confusione persiste per chi è responsabile dei dati di governance. Se non si definiscono le responsabilità, non sarà possibile rispondere alle domande seguenti.
- Chi stabilisce le metriche di successo e verifica regolarmente che il programma di governance dei dati funzioni in modo corretto?
- Chi sono i proprietari dei dati?
- Chi definisce e mantiene aggiornato un glossario aziendale?
- Chi crea e gestisce i criteri per la sicurezza dell'accesso?
- Chi tutela la privacy dei dati personali per la conformità?
- Chi controlla la qualità dei dati sui prodotti in tutte le brochure e i siti Web dei partner?
- Chi garantisce che i dati dei clienti siano coerenti in tutti i sistemi?
- Chi mantiene monitorato l'utilizzo dei dati della sottoscrizione esterna rispetto alla licenza?
- Chi controlla gli utenti con privilegi, come gli amministratori di database e gli scienziati dei dati?
- Se ne occupa un dirigente di livello C? Ci pensa un responsabile del reparto?
- Se ne occupa il responsabile di governance, rischi e conformità?
- Qual è il ruolo dell'ufficio legale?
- È responsabilità DELL'IT?
I ruoli e le responsabilità sono fondamentali per evitare confusione e per impostare le basi su si può concretizzare una cultura dei dati.
Processi di governance dei dati
I processi sono necessari, insieme ai ruoli e alle responsabilità, per:
- Gestire la definizione e la manutenzione di un vocabolario aziendale comune.
- Individuare e identificare quali dati sono disponibili, cosa significa e dove vengono archiviati.
- Classificare i dati per sapere come controllarli.
- Gestire la definizione e la manutenzione dei criteri di sicurezza dell'accesso ai dati.
- Gestire la definizione e la manutenzione delle politiche sulla privacy dei dati.
- Rilevare i problemi di qualità dei dati e risolverli.
- Applicare i criteri per assicurarsi che venga eseguita un'azione per la conformità.
- Gestire la manutenzione dei dati master.
Criteri e regole di governance dei dati
Definire i criteri e le regole per la governance di:
- Regole di integrità dei dati
- Regole e criteri di inserimento dati
- Regole e criteri di sicurezza per l'accesso ai dati
- Regole e criteri di privacy dei dati
- Regole e criteri di qualità dei dati
- Regole e criteri di manutenzione dei dati
- Regole e criteri di conservazione dei dati
Associare questi criteri e regole a ogni classe negli schemi di classificazione di governance dei dati.
Gestione dei dati master
Un altro requisito per la governance dei dati è la gestione dei dati master. I dati master sono i dati più condivisi in qualsiasi organizzazione e includono le entità dati principali. Le entità dati principali includono cliente, fornitore, materiali, dipendente e asset. Sono anche inclusi i dati del piano dei conti finanziario che si trovano in diverse applicazioni finanziarie. Poiché i dati master sono così ampiamente condivisi, è indipendente dall'applicazione. Sono necessari sia per le applicazioni di elaborazione delle transazioni operative che per i sistemi analitici. Mantenere sincronizzati questi dati può risolvere molti errori di dati ed errori di processo. Quindi, mantenerlo centralmente tramite un processo comune e sincronizzare ogni sistema che ha bisogno è la situazione ideale. Sono anche necessari criteri di governance per stabilire chi è autorizzato a mantenerli aggiornati e dove deve avvenire tale manutenzione.
Lo stesso vale per i dati di riferimento, ad esempio i set di codice e i dati dei mercati finanziari. In questo caso, la standardizzazione e la sincronizzazione dei set di codice sono note come gestione dei dati di riferimento, che è anche un requisito.
Derivazione dei metadati
Infine, esiste un requisito per la derivazione dei metadati. È possibile usare un audit trail per sapere dove sono stati originati i dati e come vengono trasformati in un report o in un archivio dati. È possibile usare i metadati per tenere traccia di chi o cosa gestisce la manutenzione dei dati, incluse tempistica e posizione per l'esecuzione di queste operazioni.
Riepilogo dei componenti necessari per la governance completa dei dati
È necessaria una soluzione completa in grado di gestire i dati per l'intero ciclo di vita in tutti gli archivi dati nel perimetro, in più cloud e nel data center.
La soluzione di governance dei dati deve avere diversi componenti:
- Visione e strategia di governance dei dati
- I dati stessi, ad esempio i dati dei clienti, i dati dei fornitori, i dati degli ordini e altri
- Ciclo di vita dei dati dalla creazione alla distruzione all'interno del quale devono essere regolati i dati
- Ruoli e responsabilità di governance dei dati (persone)
- Processi e attività di governance dei dati e come si applicano al ciclo di vita dei dati
- Criteri e regole per gestire i dati in punti diversi del ciclo di vita
- Tecnologie di governance dei dati per rendere possibile la governance dei dati