Gestion de cycle de vie des données
La gestion du cycle de vie des données consiste à utiliser certaines stratégies pour gérer efficacement les données pendant toute leur existence au sein de votre système. Ces stratégies doivent comprendre des stratégies de stockage et de données globales qui pilotent vos processus de gestion des données. Étant donné que les objectifs et les pilotes métier dictent les stratégies de gestion du cycle de vie des données, ils sont généralement liés à une infrastructure informatique globale de gouvernance et de gestion, et de contrats de niveau de service (SLA).
Une fois que vous connaissez le type de données dont vous disposez, ainsi que la façon dont elles sont utilisées, vous connaissez déjà leur évolution et leur avenir probables. Vous devez comprendre comment vos données évoluent, déterminer leur croissance, superviser les modifications d’usage au fil du temps, décider de leur durée d’existence et respecter l’ensemble des règles et réglementations qui s’y appliquent.
La gestion du cycle de vie des données répond à ces besoins en combinant des processus, des stratégies et des logiciels afin que vos équipes puissent utiliser la technologie appropriée à chaque phase du cycle de vie de vos données.
Cycle de vie des données
Les produits de données peuvent avoir différents cycles de vie. Dans un modèle de cycle de vie classique, les données récemment ingérées sont utilisées et consultées souvent. À mesure que l’âge des données augmente, le taux d’accès diminue souvent, et les données plus anciennes affichent une baisse importante de l’usage.
Toutefois, les cycles de vie des données peuvent différer de ce modèle classique. Certaines données ne sont pas utilisées après l’ingestion initiale ou elles sont rarement consultées une fois stockées. Certains produits de données peuvent expirer quelques jours ou mois après leur création, tandis que d’autres produits de données sont utilisés et modifiés activement pendant toute leur durée de vie.
La plupart des pays ont des réglementations qui définissent la durée pendant laquelle vous devez stocker des données comme les données personnelles et les données comptables. Une région ou un pays particulier peut vous obliger à conserver la documentation principale pendant cinq ans pour des données comme les factures entrantes et sortantes, les soldes de livres de trésorerie, les bons bancaires et les bulletins de salaire. La législation d’un pays peut également exiger que la documentation secondaire soit conservée pendant trois à cinq ans, notamment des documents comme des lettres, des contrats et des notes.
Gestion des cycles de vie des données
Il existe deux façons d’aborder la gestion du cycle de vie des données dans l’analytique à l’échelle du cloud.
- Vous pouvez utiliser les fonctionnalités de cycle de vie des données intégrées de chaque service Azure contenant des données persistantes comme Azure Data Lake. Cette méthode convient pour déplacer des données vers des niveaux froid et archive, mais elle ne permet pas de garantir que les données sont supprimées après une durée spécifiée.
Important
Le niveau archive n’est actuellement pas pris en charge pour les comptes de stockage redondant interzone. Pour plus d’informations, consultez Redondance des données.
- Vous pouvez intégrer le cycle de vie des données dans un processus d’intégration, ce qui permet aux propriétaires d’application métier de définir leur stratégie de cycle de vie des données. Ce processus implique une application personnalisée pour capturer les métriques clés dans des normes relatives aux métadonnées pour chaque produit de données. Une partie de cette méthode implique de déplacer des données du niveau chaud à froid à l’archive et garantit la suppression des données après une durée spécifiée.