Condividi tramite


Requisiti per la governance dei dati

L'analisi su scala cloud consiglia di considerare i requisiti seguenti per la governance dei dati:

  • Definizione di entità dati per creare un vocabolario aziendale comune in un glossario aziendale. Le entità di dati in questo contesto indicano concetti come cliente, fornitore, materiali, dipendenti e altri.
  • Identificazione e individuazione di entità dati.
  • Classificazione dei dati per gestire la sicurezza dell'accesso ai dati, la privacy dei dati e la conservazione dei dati.
  • Persone, ad esempio i proprietari dei dati con responsabilità di governance e amministratori dei dati responsabili della protezione e della qualità dei dati.
  • Processi di governance dei dati.
  • Gestione del ciclo di vita dei dati per stabilire per quanto tempo devono essere conservati i dati.
  • Criteri e regole per definire le modalità di governance di dati specifici per l'intero ciclo di vita.
  • Applicazione dei criteri su tutti gli archivi dati nel panorama dei dati distribuiti.
  • Gestione dei dati master per rendere i dati coerenti tra sistemi operativi e analitici come cliente, prodotto e fornitore.
  • Derivazione dei metadati per comprendere la trasformazione e la relazione delle entità di dati.
  • La tecnologia consente di gestire dati strutturati, multistrutturati e non strutturati. La governance può estendersi al data center, su più cloud e al perimetro.

Una sfida è che i dati vengono raccolti e archiviati in più posizioni nell'intera azienda. I dati possono includere i dati raccolti e archiviati in aree geografiche diverse e giurisdizioni legali diverse. Di conseguenza, potrebbero essere applicate normative diverse per la governance degli stessi dati in giurisdizioni diverse. Individuare i dati distribuiti su più cloud e in diverse posizioni geografiche per:

  • Comprendere quali attributi di dati, entità di dati e relazioni tra i dati esistono nel panorama dei dati distribuiti.
  • Classificare i dati per sapere come controllarli.
  • Definire i criteri per specificare come devono essere regolati i dati per ogni tipo di classificazione dei dati e gestione del ciclo di vita.
  • Applicare criteri di qualità dei dati, sicurezza dell'accesso ai dati, privacy dei dati e gestione del ciclo di vita nel panorama dei dati distribuiti.

Classificazione dei dati

La classificazione dei dati è un modo per classificare gli asset di dati assegnando tag logici o classi univoci agli asset di dati. La classificazione si basa sul contesto aziendale dei dati.

È necessario un modo per classificare i dati per capire il livello di riservatezza e per quanto tempo mantenerli. La classificazione richiede:

  • Schema di classificazione della riservatezza dei dati.
  • Schema di classificazione della conservazione dei dati.

Schema di classificazione della riservatezza dei dati

Classificazione Descrizione
Pubblico Chiunque può accedere ai dati e può essere inviato a chiunque. Ad esempio, aprire i dati per enti pubblici.
Solo per uso interno. Solo i dipendenti possono accedere ai dati e non possono essere inviati all'esterno dell'azienda.
Riservati I dati possono essere condivisi solo se sono necessari per un'attività specifica. I dati non possono essere inviati all'esterno dell'azienda senza un accordo di non divulgazione.
Sensibili (dati personali) I dati contengono informazioni private, che devono essere mascherate e condivise solo per un periodo di tempo limitato. I dati non possono essere inviati a personale non autorizzato o all'esterno dell'azienda.
Limitata I dati possono essere condivisi solo con persone denominate che sono responsabili della protezione. Ad esempio, documenti legali o segreti commerciali.

Schema di classificazione della conservazione del ciclo di vita dei dati

Conservazione Descrizione
Nessuna I dati possono essere eliminati in qualsiasi momento.
Temporanea Conservare i dati per un breve periodo di tempo. Ad esempio, mantenere i dati di Twitter per una settimana.
Periodo fisso Conservare i dati per un numero di anni impostato, dopo il quale è possibile eliminarli. Ad esempio, conservare i registri fiscali per sette anni per rispettare le leggi governative.
Permanente Non eliminare mai i dati. Ad esempio, corrispondenza legale.

Per etichettare in modo coerente i dati nel panorama dei dati distribuiti, è necessario automatizzare il processo di classificazione della riservatezza dei dati e del ciclo di vita dei dati usando le classi definite in ogni schema. L'automazione consente di essere regolati in modo coerente e corretto. Definire quindi regole e criteri per ogni classe nello schema di classificazione per specificare come gestire la governance dei dati in base alla relativa classificazione.

Ruoli e responsabilità per la governance dei dati

Un altro requisito è la necessità di definire le responsabilità. In caso contrario, la confusione persiste per chi è responsabile dei dati di governance. Se non si definiscono le responsabilità, non sarà possibile rispondere alle domande seguenti.

  • Chi stabilisce le metriche di successo e verifica regolarmente che il programma di governance dei dati funzioni in modo corretto?
  • Chi sono i proprietari dei dati?
  • Chi definisce e mantiene aggiornato un glossario aziendale?
  • Chi crea e gestisce i criteri per la sicurezza dell'accesso?
  • Chi tutela la privacy dei dati personali per la conformità?
  • Chi controlla la qualità dei dati sui prodotti in tutte le brochure e i siti Web dei partner?
  • Chi garantisce che i dati dei clienti siano coerenti in tutti i sistemi?
  • Chi mantiene monitorato l'utilizzo dei dati della sottoscrizione esterna rispetto alla licenza?
  • Chi controlla gli utenti con privilegi, come gli amministratori di database e gli scienziati dei dati?
  • Se ne occupa un dirigente di livello C? Ci pensa un responsabile del reparto?
  • Se ne occupa il responsabile di governance, rischi e conformità?
  • Qual è il ruolo dell'ufficio legale?
  • È responsabilità DELL'IT?

I ruoli e le responsabilità sono fondamentali per evitare confusione e per impostare le basi su si può concretizzare una cultura dei dati.

Processi di governance dei dati

I processi sono necessari, insieme ai ruoli e alle responsabilità, per:

  • Gestire la definizione e la manutenzione di un vocabolario aziendale comune.
  • Individuare e identificare quali dati sono disponibili, cosa significa e dove vengono archiviati.
  • Classificare i dati per sapere come controllarli.
  • Gestire la definizione e la manutenzione dei criteri di sicurezza dell'accesso ai dati.
  • Gestire la definizione e la manutenzione delle politiche sulla privacy dei dati.
  • Rilevare i problemi di qualità dei dati e risolverli.
  • Applicare i criteri per assicurarsi che venga eseguita un'azione per la conformità.
  • Gestire la manutenzione dei dati master.

Criteri e regole di governance dei dati

Definire i criteri e le regole per la governance di:

  • Regole di integrità dei dati
  • Regole e criteri di inserimento dati
  • Regole e criteri di sicurezza per l'accesso ai dati
  • Regole e criteri di privacy dei dati
  • Regole e criteri di qualità dei dati
  • Regole e criteri di manutenzione dei dati
  • Regole e criteri di conservazione dei dati

Associare questi criteri e regole a ogni classe negli schemi di classificazione di governance dei dati.

Gestione dei dati master

Un altro requisito per la governance dei dati è la gestione dei dati master. I dati master sono i dati più condivisi in qualsiasi organizzazione e includono le entità dati principali. Le entità dati principali includono cliente, fornitore, materiali, dipendente e asset. Sono anche inclusi i dati del piano dei conti finanziario che si trovano in diverse applicazioni finanziarie. Poiché i dati master sono così ampiamente condivisi, è indipendente dall'applicazione. Sono necessari sia per le applicazioni di elaborazione delle transazioni operative che per i sistemi analitici. Mantenere sincronizzati questi dati può risolvere molti errori di dati ed errori di processo. Quindi, mantenerlo centralmente tramite un processo comune e sincronizzare ogni sistema che ha bisogno è la situazione ideale. Sono anche necessari criteri di governance per stabilire chi è autorizzato a mantenerli aggiornati e dove deve avvenire tale manutenzione.

Lo stesso vale per i dati di riferimento, ad esempio i set di codice e i dati dei mercati finanziari. In questo caso, la standardizzazione e la sincronizzazione dei set di codice sono note come gestione dei dati di riferimento, che è anche un requisito.

Derivazione dei metadati

Infine, esiste un requisito per la derivazione dei metadati. È possibile usare un audit trail per sapere dove sono stati originati i dati e come vengono trasformati in un report o in un archivio dati. È possibile usare i metadati per tenere traccia di chi o cosa gestisce la manutenzione dei dati, incluse tempistica e posizione per l'esecuzione di queste operazioni.

Riepilogo dei componenti necessari per la governance completa dei dati

È necessaria una soluzione completa in grado di gestire i dati per l'intero ciclo di vita in tutti gli archivi dati nel perimetro, in più cloud e nel data center.

Diagramma del framework di governance dei dati.

La soluzione di governance dei dati deve avere diversi componenti:

  • Visione e strategia di governance dei dati
  • I dati stessi, ad esempio i dati dei clienti, i dati dei fornitori, i dati degli ordini e altri
  • Ciclo di vita dei dati dalla creazione alla distruzione all'interno del quale devono essere regolati i dati
  • Ruoli e responsabilità di governance dei dati (persone)
  • Processi e attività di governance dei dati e come si applicano al ciclo di vita dei dati
  • Criteri e regole per gestire i dati in punti diversi del ciclo di vita
  • Tecnologie di governance dei dati per rendere possibile la governance dei dati

Passaggi successivi