Requisitos para a regulação dos dados
A análise em escala de nuvem recomenda que você considere os seguintes requisitos para controlar dados:
- Definição de entidade de dados para criar um vocabulário empresarial comum num glossário empresarial. Entidades de dados neste contexto significam conceitos como cliente, fornecedor, materiais, funcionário e outros.
- Identificação e descoberta de entidades de dados.
- Classificação de dados para controlar a segurança de acesso aos dados, a privacidade dos dados e a retenção de dados.
- Pessoas, como proprietários de dados com responsabilidade de governança e administradores de dados responsáveis pela proteção e qualidade de dados.
- Processos de governança de dados.
- Gerenciamento do ciclo de vida dos dados para controlar por quanto tempo os dados devem ser mantidos.
- Políticas e regras para definir como dados específicos devem ser governados ao longo de seu ciclo de vida.
- Aplicação de políticas em armazenamentos de dados no cenário de dados distribuídos.
- Gerenciamento de dados mestre para tornar os dados consistentes em todos os sistemas operacionais e analíticos, como cliente, produto e fornecedor.
- Linhagem de metadados para compreender a transformação e a relação das entidades de dados.
- Tecnologia para tornar possível governar dados estruturados, multi-estruturados e não estruturados. A governança pode abranger o datacenter, várias nuvens e a borda.
Um desafio é que os dados estão sendo coletados e armazenados em vários locais da empresa. Os dados podem incluir dados recolhidos e armazenados em diferentes geografias e diferentes jurisdições legais. Consequentemente, pode aplicar-se legislação diferente para regular os mesmos dados em jurisdições diferentes. Descubra dados distribuídos em várias nuvens e localizações geográficas para:
- Entenda quais atributos de dados, entidades de dados e relações de dados existem no cenário de dados distribuídos.
- Classifique os dados para saber como governá-los.
- Defina políticas para especificar como os dados devem ser governados para cada tipo de classificação de dados e gerenciamento do ciclo de vida.
- Imponha políticas de qualidade de dados, segurança de acesso a dados, privacidade de dados e gerenciamento de ciclo de vida em todo o cenário de dados distribuídos.
Classificação de dados
A classificação de dados é uma maneira de categorizar ativos de dados atribuindo marcas lógicas exclusivas ou classes aos ativos de dados. A classificação é baseada no contexto comercial dos dados.
É preciso haver uma maneira de classificar os dados para entender seu nível de confidencialidade e por quanto tempo mantê-los. A classificação exige:
- Um sistema de classificação da confidencialidade dos dados.
- Um esquema de classificação de retenção de dados.
Sistema de classificação da confidencialidade dos dados
Classificação | Description |
---|---|
Público | Qualquer pessoa pode aceder aos dados e estes podem ser enviados a qualquer pessoa. Por exemplo, dados governamentais abertos. |
Apenas para uso interno | Apenas os funcionários podem acessar os dados e eles não podem ser enviados para fora da empresa. |
Confidencial | Os dados só podem ser partilhados se forem necessários para uma tarefa específica. Os dados não podem ser enviados para fora da empresa sem um acordo de confidencialidade. |
Sensível (dados pessoais) | Os dados contêm informações privadas, que devem ser mascaradas e compartilhadas apenas com base na necessidade de conhecimento por um tempo limitado. Os dados não podem ser enviados para pessoal não autorizado ou fora da empresa. |
Restrito | Os dados só podem ser partilhados com pessoas nomeadas que sejam responsáveis pela sua proteção. Por exemplo, documentos legais ou segredos comerciais. |
Esquema de classificação de retenção do ciclo de vida dos dados
Retenção | Description |
---|---|
None | Os dados podem ser apagados a qualquer momento. |
Temporário | Guarde os dados por um curto período de tempo. Por exemplo, mantenha os dados do Twitter por uma semana. |
Período fixo | Guarde os dados durante um determinado número de anos, findos os quais podem ser eliminados. Por exemplo, manter registos fiscais durante sete anos para cumprir as leis governamentais. |
Permanente | Nunca apague dados. Por exemplo, a correspondência jurídica. |
É necessário automatizar o processo de classificação de confidencialidade e retenção do ciclo de vida dos dados usando as classes definidas em cada esquema para rotular dados de forma consistente em todo o cenário de dados distribuídos. A automação permite que ele seja governado de forma consistente e correta. Em seguida, defina regras e políticas para cada classe no esquema de classificação para especificar como governar os dados de acordo com sua classificação.
Funções e responsabilidades de governança de dados
Outro requisito é a necessidade de prestação de contas. Caso contrário, persiste a confusão sobre quem é responsável pela gestão dos dados. Se não houver prestação de contas, como responder às seguintes perguntas?
- Quem define métricas de sucesso e monitora o funcionamento do programa de governança de dados?
- Quem são os proprietários dos dados?
- Quem define e mantém um glossário de negócios?
- Quem cria e mantém políticas de segurança de acesso?
- Quem está protegendo a privacidade dos dados pessoais para fins de conformidade?
- Quem cuida da qualidade dos dados dos produtos em todas as brochuras e sites parceiros?
- Quem garante que os dados dos clientes são consistentes em todos os sistemas?
- Quem está policiando o uso de dados de assinatura externa versus a licença?
- Quem está policiando usuários privilegiados, como administradores de banco de dados e cientistas de dados?
- É um executivo C-level? É um chefe de departamento?
- É o chefe de governança, risco e conformidade?
- E o departamento jurídico?
- É responsabilidade da TI?
Papéis e responsabilidades são necessários para evitar confusões e estabelecer a base sobre a qual uma cultura de dados pode se materializar.
Processos de governança de dados
Os processos são necessários, juntamente com funções e responsabilidades, para:
- Governar a definição e manutenção de um vocabulário empresarial comum.
- Descubra e identifique quais dados você tem, o que significa e onde estão armazenados.
- Classifique os dados para saber como governá-los.
- Governar a definição e manutenção de políticas de segurança de acesso a dados.
- Governar a definição e manutenção das políticas de privacidade de dados.
- Detete problemas de qualidade de dados e corrija-os.
- Aplique políticas para garantir que sejam tomadas medidas para fins de conformidade.
- Gerir a manutenção de dados principais.
Políticas e regras de governança de dados
Definir políticas e regras para governar:
- Regras de integridade dos dados
- Políticas e regras de ingestão de dados
- Políticas e regras de segurança de acesso a dados
- Políticas e regras de privacidade de dados
- Políticas e regras de qualidade de dados
- Políticas e regras de manutenção de dados
- Políticas e regras de retenção de dados
Associe essas políticas e regras a cada classe nos esquemas de classificação de governança de dados.
Gestão de dados mestres
Outro requisito no controle de dados é o gerenciamento de dados mestres. Os dados mestre são os dados mais amplamente compartilhados em qualquer organização e incluem entidades de dados principais. As entidades de dados principais incluem cliente, fornecedor, materiais, funcionário e ativo. Também inclui dados do plano de contas financeiros que são encontrados em diferentes aplicações financeiras. Como os dados mestre são amplamente compartilhados, eles são agnósticos em relação ao aplicativo. É necessário tanto para aplicações operacionais de processamento de transações como para sistemas analíticos. Manter esses dados sincronizados pode resolver muitos erros de dados e erros de processo. Assim, mantê-lo centralmente através de um processo comum e sincronizar todos os sistemas que precisam dele é a situação ideal. Além disso, é necessária governança sobre quem pode mantê-la e onde essa manutenção precisa acontecer.
O mesmo se aplica aos dados de referência, como conjuntos de códigos e dados dos mercados financeiros. Neste caso, a padronização e sincronização de conjuntos de códigos são conhecidas como gerenciamento de dados de referência, que também é um requisito.
Linhagem de metadados
Finalmente, há um requisito para a linhagem de metadados. Você pode usar uma trilha de auditoria para saber onde os dados se originaram e como eles foram transformados a caminho de um relatório ou armazenamento de dados. Você pode usar metadados para rastrear quem ou o que está mantendo os dados, incluindo quando e onde eles ocorrem.
Resumo do que é necessário para a governança de dados de ponta a ponta
Você precisa de uma solução completa que possa controlar os dados durante todo o seu ciclo de vida em armazenamentos de dados na borda, em várias nuvens e no datacenter.
Sua solução de governança de dados deve ter vários componentes:
- Uma visão e uma estratégia de governança de dados
- Os dados em si, como dados de clientes, dados de fornecedores, dados de pedidos e outros
- O ciclo de vida dos dados, desde a criação até a destruição, dentro do qual os dados precisam ser controlados
- Funções e responsabilidades de governança de dados (pessoas)
- Processos e atividades de governança de dados e como eles se aplicam ao ciclo de vida dos dados
- Políticas e regras para controlar dados em diferentes pontos do ciclo de vida
- Tecnologias de governança de dados para ajudar a tornar possível a governança de dados