Gestione del ciclo di vita dei dati
La gestione del ciclo di vita dei dati è la pratica dell'uso di criteri specifici per gestire in modo efficace i dati per l'intera durata del sistema. Questi criteri devono essere costituiti da criteri di archiviazione e dati generali che guidano i processi di gestione dei dati. Poiché gli obiettivi aziendali e i driver determinano i criteri di gestione del ciclo di vita dei dati, in genere si collegano a un framework di governance, gestione e contratti di servizio IT complessivi.
Dopo aver appreso il tipo di dati disponibili e il modo in cui verranno usati, si conosce già la sua evoluzione e il destino più probabili. È necessario comprendere in che modo i dati si evolve, determinare in che modo aumentano, monitorare le modifiche nell'utilizzo nel tempo, decidere per quanto tempo devono esistere e rispettare tutte le regole e le normative applicabili a tali dati.
La gestione del ciclo di vita dei dati soddisfa queste esigenze usando una combinazione di processi, criteri e software in modo che i team possano usare la tecnologia appropriata per ogni fase del ciclo di vita dei dati.
Ciclo di vita dei dati
I prodotti dati possono avere cicli di vita diversi. In un modello tipico del ciclo di vita, i dati appena inseriti vengono usati e a cui si accede spesso. Con l'aumentare dell'età, la frequenza di accesso diminuisce spesso e i dati meno recenti vedono una drastica diminuzione dell'utilizzo. Alcuni prodotti dati potrebbero scadere giorni o mesi dopo la loro creazione, mentre altri prodotti dati vengono usati e modificati attivamente nell'intera durata.
I cicli di vita dei dati possono tuttavia differire da questo modello tipico. Alcuni dati rimangono inutilizzati dopo l'inserimento iniziale o vengono raramente consultati dopo l'archiviazione. La maggior parte delle posizioni prevede normative che determinano per quanto tempo è necessario archiviare i dati, ad esempio i dati personali e i dati contabili. Un determinato paese/area geografica potrebbe richiedere di conservare la documentazione primaria per cinque anni per i dati, ad esempio fatture in ingresso e in uscita, saldi del libro in contanti, voucher bancari e buste di stipendio. Potrebbe anche essere necessario conservare la documentazione secondaria per tre o cinque anni, che include elementi come lettere, accordi e note.
Gestione dei cicli di vita dei dati
Esistono due modi per affrontare la gestione del ciclo di vita dei dati nell'analisi su scala cloud:
- È possibile usare le funzionalità predefinite del ciclo di vita dei dati di ogni servizio di Azure contenente dati persistenti, ad esempio Azure Data Lake. Questo metodo è utile per lo spostamento dei dati a livelli ad accesso sporadico e archivio, ma non riesce a garantire che i dati vengano eliminati dopo un periodo di tempo specificato.
Importante
Il livello archivio non è attualmente supportato per gli account di archiviazione con ridondanza della zona. Per altre informazioni, vedere Ridondanza dei dati.
- È possibile integrare il ciclo di vita dei dati in un processo di onboarding, che consente ai proprietari aziendali di applicazioni di definire i criteri relativi al ciclo di vita dei dati. Questo processo implica un'applicazione personalizzata per acquisire le metriche chiave in standard di metadati per ogni prodotto dati. Parte di questo metodo comporta lo spostamento di dati da caldo a freddo fino all'archiviazione e garantisce l'eliminazione dei dati dopo un periodo di tempo specificato.