Compartilhar via


Processos de governança de dados

Há quatro categorias de processos de governança de dados.

Categoria de processo Processos
Processos de descoberta de dados, cuja finalidade é entender o panorama de dados Um processo de descoberta, mapeamento e catalogação de dados e entidades de dados
Um processo de descoberta de criação de perfil de dados a fim de determinar a qualidade dos dados
Um processo de classificação de governança e descoberta de dados confidenciais
Um processo de descoberta de manutenção de dados para análise CRUD, por exemplo, de arquivos de log, para entender o uso e a manutenção de dados como dados mestres em toda a empresa
Processos de definição da governança de dados Criar e manter um vocabulário de negócios comum; no glossário de negócios, definir entidades de dados, incluindo dados mestres, nomes de atributos de dados, regras de integridade de dados e formatos válidos
Definir dados de referência a fim de padronizar conjuntos de códigos em toda a empresa
Definir esquemas de classificação de governança de dados para rotular os dados e determinar como governá-los
Definir regras e políticas de governança de dados para controlar os ciclos de vida de documentos e entidades de dados
Definir limites e métricas de sucesso
Processos de imposição de regras e políticas de governança de dados Um processo para automatizar a aplicação e a imposição de regras e políticas de governança de dados
Um processo para aplicar e impor políticas e regras manualmente
Processos de governança de dados controlados por eventos, sob demanda e controlados por temporizador (lote) publicados como serviços que podem ser invocados para governança de:
Ingestão de dados – catalogação, classificação, atribuição de proprietário e armazenamento
Qualidade dos dados
Segurança de acesso a dados
Privacidade dos dados
Uso de dados, por exemplo, para compartilhamento e para garantir que dados licenciados sejam usados somente para os fins aprovados
Manutenção de dados, como dados mestre
Retenção de dados
Sincronização de dados de dados mestre e dados de referência
Processos de monitoramento Monitorar e auditar atividades de uso de dados, a qualidade dos dados, a segurança do acesso a dados, a privacidade de dados, a manutenção de dados e a retenção de dados
Monitorar a detecção e a resolução de violações de regras e políticas

O vocabulário de negócios comum deve ser definido em um glossário de negócios dentro de um catálogo de dados.

Os grupos de trabalho de governança de dados planejam e desenvolvem a definição de dados e a melhoria de domínios de dados específicos (por exemplo, cliente ou fornecedor); atualizar o quadro de controle de governança de dados em andamento; e gerenciam a administração em toda a empresa para um domínio específico. Cada grupo de trabalho deve assumir a responsabilidade de definir uma entidade de dados específica ou uma área de tema dos dados, como várias entidades relacionadas. Assim, é possível trabalhar com várias entidades de dados no vocabulário, juntamente com suas políticas e regras. Para obter informações, consulte Funções e responsabilidades de governança de dados

Diagrama de definição de entidades em um vocabulário de negócios comum. Figura 1: Exemplo de grupo de trabalho de governança de dados

A integração do glossário de negócios do catálogo a outras tecnologias é necessária para utilizar nomes de dados comuns consistentes em todas as tecnologias. Exemplos de outras tecnologias com as quais é possível fazer a integração incluem:

  • Ferramentas de ETL (extração, transformação e carregamento)
  • Ferramentas de modelagem de dados
  • Ferramentas de BI, gerenciadores de banco de dados
  • Gerenciamento de dados mestre
  • Ferramentas de virtualização de dados
  • Ferramentas de desenvolvimento de software

Uma prática recomendada para criar um vocabulário de negócios comum é criar um modelo de conceito de dados. O modelo tem uma abordagem de cima para baixo que identifica conceitos de dados que podem ser usados como entidades de dados em um vocabulário de negócios comum. Em seguida, é possível atribuir um grupo de trabalho de governança de dados diferente a cada conceito de dados (entidade) ou a um grupo de conceitos de dados relacionados (área de assunto). Diferentes grupos de trabalho são atribuídos para governar diferentes entidades de dados em todo o cenário.

Ao criar um vocabulário de negócios comum, você pode usar o software de catálogo de dados para descobrir automaticamente quais dados estão presentes em diversos repositórios de dados. Isso ajuda a identificar todos os atributos associados a entidades de dados específicas. Essa é uma abordagem de baixo para cima. Usando uma abordagem de cima para baixo de modelo de conceito de dados para começar e uma abordagem de descoberta de dados automatizada de baixo para cima para identificar os atributos de uma entidade de dados, é possível que vários grupos de trabalho criem, de modo rápido e incremental, um vocabulário de negócios comum.

O uso de um catálogo de dados para descoberta de dados automatizada permite o mapeamento de dados diferentes para um vocabulário comum. O catálogo de dados pode ajudar você a entender onde os dados de cada entidade de dados específica no glossário de negócios estão localizados na empresa.

Políticas e regras para controlar dados em diferentes pontos do ciclo de vida

As políticas de governança de dados descrevem um conjunto de regras para controlar a integridade, a qualidade, a segurança de acesso, a privacidade e a retenção de dados. Há diferentes tipos de política, incluindo:

  • Políticas de integridade de dados, como valores válidos e integridade referencial.
  • Políticas de qualidade de dados, com regras de padronização, limpeza e correspondência de dados.
  • Políticas de proteção de dados, com regras de segurança de acesso e privacidade de dados.
  • Políticas de retenção de dados para gerenciar o ciclo de vida, com regras de retenção, arquivamento e backup. Várias versões de uma política podem ser necessárias para governar os mesmos dados em diferentes jurisdições legais.

O esquema de classificação de confidencialidade de dados tem cinco níveis de classificação:

  • Público
  • Somente para uso interno
  • Confidencial
  • Dados pessoais confidenciais
  • Restritos

Governe os dados combinando esse esquema de classificação com as políticas e regras. Use cada um dos cinco níveis para rotular os dados, como dados pessoais confidenciais. Ao criar regras para dados pessoais confidenciais e anexar essas regras a uma política, você cria uma política para os dados pessoais confidenciais. Você pode anexar a política ao rótulo de dados pessoais confidenciais e, então, anexar o rótulo de dados pessoais confidenciais a esses dados. Assim, todos os dados rotulados como dados pessoais confidenciais ficam sujeitos às mesmas políticas e regras. Esse processo é conhecido como gerenciamento de políticas baseado em marca. Ele é flexível porque uma regra ou política individual pode ser alterada de modo independente. Todos os dados rotulados como dados pessoais confidenciais são governados pelas novas regras. Da mesma forma, um rótulo de dados pessoais confidenciais pode ser desvinculado dos dados para que seja usado um rótulo de confidencial. Nesse caso, os dados passam instantaneamente a ser governados por um novo conjunto de políticas e regras associadas ao rótulo de confidencial.

Após você definir as políticas e regras em um catálogo de dados para cada classe em um esquema de classificação de governança de dados, elas podem ser passadas para outras tecnologias do catálogo de dados, por meio de APIs, para que sejam impostas. Como alternativa, uma plataforma de gerenciamento de dados comum capaz de se conectar a vários armazenamentos de dados pode impor as regras e políticas.

Assim, deve ser possível monitorar a qualidade, a privacidade, a segurança de acesso, o uso, a manutenção e a retenção de dados e de entidades de dados específicas em todo o ciclo de vida.

Próximas etapas