Processos de governança de dados
Existem quatro categorias de processos de governança de dados.
Categoria do processo | Processos |
---|---|
Processos de descoberta de dados, para entender o cenário de dados | Um processo de descoberta, mapeamento e catalogação de dados e entidades de dados Um processo de descoberta de perfil de dados para determinar a qualidade dos dados Um processo de descoberta de dados confidenciais e de classificação e governança Um processo de descoberta de gestão de dados para análise CRUD, como a partir de arquivos de log, para entender o uso e a manutenção de dados, como dados principais em toda a empresa |
Processos de definição de governança de dados | Criar e manter um vocabulário comercial comum em um glossário de negócios Definir entidades de dados, incluindo dados mestres, nomes de atributos de dados, regras de integridade de dados e formatos válidos Definir dados de referência para padronizar conjuntos de códigos em toda a empresa Definir esquemas de classificações de governança de dados para rotular dados e determinar como governá-los Definir políticas e regras de governança de dados para governar os ciclos de vida da entidade de dados e dos documentos Definir métricas e limites de sucesso |
Política de governança de dados e processos de aplicação de regras | Um processo para automatizar a aplicação e a imposição de políticas e regras de governança de dados Um processo para aplicar e impor manualmente políticas e regras Processos de governança de dados orientados a eventos, sob demanda e por temporizador (em lote) publicados como serviços que podem ser invocados para governar: Ingestão de dados - catalogação, classificação, atribuição de proprietário e armazenamento Qualidade dos dados Segurança do acesso aos dados Privacidade de dados Uso de dados, por exemplo, incluindo compartilhamento e para garantir que os dados licenciados sejam usados apenas para fins aprovados Manutenção de dados, como dados de referência Retenção de dados Dados mestre e sincronização de dados de referência |
Acompanhamento de processos | Monitorar e auditar a atividade de uso de dados, qualidade de dados, segurança de acesso a dados, privacidade de dados, manutenção de dados e retenção de dados Monitore a deteção e a resolução de violações de regras de política |
O vocabulário comum de negócios deve ser definido em um glossário de negócios dentro de um catálogo de dados.
Grupos de trabalho de governança de dados planejam e desenvolvem definindo dados e melhorando domínios de dados específicos (por exemplo, cliente ou fornecedor); atualizar o conselho de controle de governança de dados sobre os progressos; e gerenciar a administração em toda a empresa para um domínio específico. Cada grupo de trabalho deve assumir a responsabilidade de definir uma entidade de dados específica ou área de assunto dos dados, como várias entidades relacionadas. Várias entidades de dados no vocabulário, juntamente com as políticas e regras, podem ser trabalhadas em paralelo. Para obter informações, consulte Funções e responsabilidades de governança de dados
Figura 1: Exemplo de grupo de trabalho de governança de dados
A integração do glossário de negócios do catálogo com outras tecnologias é então necessária para obter nomes de dados comuns consistentes em todas as tecnologias. Exemplos de outras tecnologias a integrar incluem:
- Ferramentas de extração, transformação e carregamento (ETL)
- Ferramentas de modelagem de dados
- Ferramentas de BI, sistemas de gestão de bases de dados
- Gerenciamento de dados mestre
- Ferramentas de virtualização de dados
- Ferramentas de desenvolvimento de software
Uma boa prática para criar um vocabulário empresarial comum é desenvolver um modelo de conceito de dados. Este modelo usa uma abordagem descendente para identificar conceitos de dados que podem ser usados como entidades de dados em um vocabulário de negócios comum. Diferentes grupos de trabalho de governança de dados podem ser atribuídos a cada conceito de dados (entidade) ou grupo de conceitos de dados relacionados (área temática). Esses grupos de trabalho são responsáveis por governar diferentes entidades de dados em todo o cenário.
Ao criar um vocabulário comercial comum, você pode usar o software de catálogo de dados para descobrir automaticamente quais dados existem em vários armazenamentos de dados. Este software ajuda a identificar todos os atributos associados a entidades de dados específicas, o que é uma abordagem ascendente.
Vários grupos de trabalho podem criar um vocabulário de negócios comum rapidamente combinando a abordagem descendente de um modelo de conceito de dados com a abordagem ascendente da descoberta automatizada de dados.
O uso de um catálogo de dados para descoberta automatizada de dados permite o mapeamento de dados diferentes para um vocabulário comum. O catálogo de dados pode ajudá-lo a entender onde os dados de cada entidade de dados específica no glossário de negócios estão localizados em toda a empresa.
Políticas e regras para controlar dados em diferentes pontos do ciclo de vida
As políticas de governança de dados descrevem um conjunto de regras para controlar a integridade, a qualidade, a segurança de acesso, a privacidade e a retenção de dados. Existem diferentes tipos de políticas que incluem:
- Políticas de integridade de dados, como valores válidos, integridade referencial.
- Políticas de qualidade de dados com padronização, limpeza e regras de correspondência.
- Políticas de proteção de dados com regras de segurança de acesso e privacidade de dados.
- Políticas de retenção de dados para gerenciar o ciclo de vida com regras de retenção, arquivamento e backup. Várias versões de uma política podem ser necessárias para governar os mesmos dados em diferentes jurisdições legais.
O esquema de classificação da confidencialidade dos dados tem cinco níveis de classificação:
- Público
- Apenas para uso interno
- Confidencial
- Dados pessoais sensíveis
- Restrito
Governe os dados combinando esse esquema de classificação com políticas e regras. Use cada um dos cinco níveis para rotular dados, como dados pessoais confidenciais. Ao criar regras para dados pessoais confidenciais e anexar essas regras a uma política, você cria uma política para dados pessoais confidenciais. Pode anexar a política à etiqueta de dados pessoais sensíveis e, em seguida, anexar a etiqueta de dados pessoais sensíveis aos dados. Desta forma, todos os dados rotulados como dados pessoais sensíveis estão sujeitos às mesmas políticas e regras. Esse processo é conhecido como gerenciamento de políticas baseado em tags. É flexível porque uma regra individual ou uma política pode ser alterada de forma independente. Todos os dados rotulados como dados pessoais sensíveis são regidos pelas novas regras. Do mesmo modo, uma etiqueta de dados pessoais sensíveis pode ser separada dos dados e uma etiqueta confidencial pode ser utilizada em vez disso. Nesse caso, os dados tornam-se instantaneamente regidos por um novo conjunto de políticas e regras associadas ao rótulo confidencial.
Depois de definir políticas e regras em um catálogo de dados para cada classe em um esquema de classificação de governança de dados, elas podem ser passadas para outras tecnologias de um catálogo de dados, por meio de APIs, para que sejam aplicadas. Em vez disso, uma plataforma comum de gerenciamento de dados que possa se conectar a vários armazenamentos de dados poderia potencialmente impô-los.
Deve então ser possível monitorizar a qualidade dos dados, a privacidade, a segurança de acesso, a utilização, a manutenção e a retenção de entidades de dados específicas ao longo do seu ciclo de vida.