Processos de governança de dados
Há quatro categorias de processos de governança de dados.
Categoria de processo | Processos |
---|---|
Processos de descoberta de dados, cuja finalidade é entender o panorama de dados | Um processo de descoberta, mapeamento e catalogação de dados e entidades de dados Um processo de descoberta de criação de perfil de dados a fim de determinar a qualidade dos dados Um processo de classificação de governança e descoberta de dados confidenciais Um processo de descoberta de manutenção de dados para análise CRUD, por exemplo, de arquivos de log, para entender o uso e a manutenção de dados como dados mestres em toda a empresa |
Processos de definição da governança de dados | Criar e manter um vocabulário de negócios comum; no glossário de negócios, definir entidades de dados, incluindo dados mestres, nomes de atributos de dados, regras de integridade de dados e formatos válidos Definir dados de referência a fim de padronizar conjuntos de códigos em toda a empresa Definir esquemas de classificação de governança de dados para rotular os dados e determinar como governá-los Definir regras e políticas de governança de dados para controlar os ciclos de vida de documentos e entidades de dados Definir limites e métricas de sucesso |
Processos de imposição de regras e políticas de governança de dados | Um processo para automatizar a aplicação e a imposição de regras e políticas de governança de dados Um processo para aplicar e impor políticas e regras manualmente Processos de governança de dados controlados por eventos, sob demanda e controlados por temporizador (lote) publicados como serviços que podem ser invocados para governança de: Ingestão de dados – catalogação, classificação, atribuição de proprietário e armazenamento Qualidade dos dados Segurança de acesso a dados Privacidade dos dados Uso de dados, por exemplo, para compartilhamento e para garantir que dados licenciados sejam usados somente para os fins aprovados Manutenção de dados, como dados mestre Retenção de dados Sincronização de dados de dados mestre e dados de referência |
Processos de monitoramento | Monitorar e auditar atividades de uso de dados, a qualidade dos dados, a segurança do acesso a dados, a privacidade de dados, a manutenção de dados e a retenção de dados Monitorar a detecção e a resolução de violações de regras e políticas |
O vocabulário de negócios comum deve ser definido em um glossário de negócios dentro de um catálogo de dados.
Os grupos de trabalho de governança de dados planejam e desenvolvem a definição de dados e a melhoria de domínios de dados específicos (por exemplo, cliente ou fornecedor); atualizar o quadro de controle de governança de dados em andamento; e gerenciam a administração em toda a empresa para um domínio específico. Cada grupo de trabalho deve assumir a responsabilidade de definir uma entidade de dados específica ou uma área de tema dos dados, como várias entidades relacionadas. Assim, é possível trabalhar com várias entidades de dados no vocabulário, juntamente com suas políticas e regras. Para obter informações, consulte Funções e responsabilidades de governança de dados
Figura 1: Exemplo de grupo de trabalho de governança de dados
A integração do glossário de negócios do catálogo a outras tecnologias é necessária para utilizar nomes de dados comuns consistentes em todas as tecnologias. Exemplos de outras tecnologias com as quais é possível fazer a integração incluem:
- Ferramentas de ETL (extração, transformação e carregamento)
- Ferramentas de modelagem de dados
- Ferramentas de BI, gerenciadores de banco de dados
- Gerenciamento de dados mestre
- Ferramentas de virtualização de dados
- Ferramentas de desenvolvimento de software
Uma prática recomendada para criar um vocabulário de negócios comum é criar um modelo de conceito de dados. O modelo tem uma abordagem de cima para baixo que identifica conceitos de dados que podem ser usados como entidades de dados em um vocabulário de negócios comum. Em seguida, é possível atribuir um grupo de trabalho de governança de dados diferente a cada conceito de dados (entidade) ou a um grupo de conceitos de dados relacionados (área de assunto). Diferentes grupos de trabalho são atribuídos para governar diferentes entidades de dados em todo o cenário.
Ao criar um vocabulário de negócios comum, você pode usar o software de catálogo de dados para descobrir automaticamente quais dados estão presentes em diversos repositórios de dados. Isso ajuda a identificar todos os atributos associados a entidades de dados específicas. Essa é uma abordagem de baixo para cima. Usando uma abordagem de cima para baixo de modelo de conceito de dados para começar e uma abordagem de descoberta de dados automatizada de baixo para cima para identificar os atributos de uma entidade de dados, é possível que vários grupos de trabalho criem, de modo rápido e incremental, um vocabulário de negócios comum.
O uso de um catálogo de dados para descoberta de dados automatizada permite o mapeamento de dados diferentes para um vocabulário comum. O catálogo de dados pode ajudar você a entender onde os dados de cada entidade de dados específica no glossário de negócios estão localizados na empresa.
Políticas e regras para controlar dados em diferentes pontos do ciclo de vida
As políticas de governança de dados descrevem um conjunto de regras para controlar a integridade, a qualidade, a segurança de acesso, a privacidade e a retenção de dados. Há diferentes tipos de política, incluindo:
- Políticas de integridade de dados, como valores válidos e integridade referencial.
- Políticas de qualidade de dados, com regras de padronização, limpeza e correspondência de dados.
- Políticas de proteção de dados, com regras de segurança de acesso e privacidade de dados.
- Políticas de retenção de dados para gerenciar o ciclo de vida, com regras de retenção, arquivamento e backup. Várias versões de uma política podem ser necessárias para governar os mesmos dados em diferentes jurisdições legais.
O esquema de classificação de confidencialidade de dados tem cinco níveis de classificação:
- Público
- Somente para uso interno
- Confidencial
- Dados pessoais confidenciais
- Restritos
Governe os dados combinando esse esquema de classificação com as políticas e regras. Use cada um dos cinco níveis para rotular os dados, como dados pessoais confidenciais. Ao criar regras para dados pessoais confidenciais e anexar essas regras a uma política, você cria uma política para os dados pessoais confidenciais. Você pode anexar a política ao rótulo de dados pessoais confidenciais e, então, anexar o rótulo de dados pessoais confidenciais a esses dados. Assim, todos os dados rotulados como dados pessoais confidenciais ficam sujeitos às mesmas políticas e regras. Esse processo é conhecido como gerenciamento de políticas baseado em marca. Ele é flexível porque uma regra ou política individual pode ser alterada de modo independente. Todos os dados rotulados como dados pessoais confidenciais são governados pelas novas regras. Da mesma forma, um rótulo de dados pessoais confidenciais pode ser desvinculado dos dados para que seja usado um rótulo de confidencial. Nesse caso, os dados passam instantaneamente a ser governados por um novo conjunto de políticas e regras associadas ao rótulo de confidencial.
Após você definir as políticas e regras em um catálogo de dados para cada classe em um esquema de classificação de governança de dados, elas podem ser passadas para outras tecnologias do catálogo de dados, por meio de APIs, para que sejam impostas. Como alternativa, uma plataforma de gerenciamento de dados comum capaz de se conectar a vários armazenamentos de dados pode impor as regras e políticas.
Assim, deve ser possível monitorar a qualidade, a privacidade, a segurança de acesso, o uso, a manutenção e a retenção de dados e de entidades de dados específicas em todo o ciclo de vida.