Partilhar via


Requisitos para a regulação dos dados

A análise em escala de nuvem recomenda que você considere os seguintes requisitos para controlar dados:

  • Definição de entidade de dados para criar um vocabulário empresarial comum num glossário empresarial. Entidades de dados neste contexto significam conceitos como cliente, fornecedor, materiais, funcionário e outros.
  • Identificação e descoberta de entidades de dados.
  • Classificação de dados para controlar a segurança de acesso aos dados, a privacidade dos dados e a retenção de dados.
  • Pessoas, como proprietários de dados com responsabilidade de governança e administradores de dados responsáveis pela proteção e qualidade de dados.
  • Processos de governança de dados.
  • Gerenciamento do ciclo de vida dos dados para controlar por quanto tempo os dados devem ser mantidos.
  • Políticas e regras para definir como dados específicos devem ser governados ao longo de seu ciclo de vida.
  • Aplicação de políticas em armazenamentos de dados no cenário de dados distribuídos.
  • Gerenciamento de dados mestre para tornar os dados consistentes em todos os sistemas operacionais e analíticos, como cliente, produto e fornecedor.
  • Linhagem de metadados para compreender a transformação e a relação das entidades de dados.
  • Tecnologia para tornar possível governar dados estruturados, multi-estruturados e não estruturados. A governança pode abranger o datacenter, várias nuvens e a borda.

Um desafio é que os dados estão sendo coletados e armazenados em vários locais da empresa. Os dados podem incluir dados recolhidos e armazenados em diferentes geografias e diferentes jurisdições legais. Consequentemente, pode aplicar-se legislação diferente para regular os mesmos dados em jurisdições diferentes. Descubra dados distribuídos em várias nuvens e localizações geográficas para:

  • Entenda quais atributos de dados, entidades de dados e relações de dados existem no cenário de dados distribuídos.
  • Classifique os dados para saber como governá-los.
  • Defina políticas para especificar como os dados devem ser governados para cada tipo de classificação de dados e gerenciamento do ciclo de vida.
  • Imponha políticas de qualidade de dados, segurança de acesso a dados, privacidade de dados e gerenciamento de ciclo de vida em todo o cenário de dados distribuídos.

Classificação de dados

A classificação de dados é uma maneira de categorizar ativos de dados atribuindo marcas lógicas exclusivas ou classes aos ativos de dados. A classificação é baseada no contexto comercial dos dados.

É preciso haver uma maneira de classificar os dados para entender seu nível de confidencialidade e por quanto tempo mantê-los. A classificação exige:

  • Um sistema de classificação da confidencialidade dos dados.
  • Um esquema de classificação de retenção de dados.

Sistema de classificação da confidencialidade dos dados

Classificação Description
Público Qualquer pessoa pode aceder aos dados e estes podem ser enviados a qualquer pessoa. Por exemplo, dados governamentais abertos.
Apenas para uso interno Apenas os funcionários podem acessar os dados e eles não podem ser enviados para fora da empresa.
Confidencial Os dados só podem ser partilhados se forem necessários para uma tarefa específica. Os dados não podem ser enviados para fora da empresa sem um acordo de confidencialidade.
Sensível (dados pessoais) Os dados contêm informações privadas, que devem ser mascaradas e compartilhadas apenas com base na necessidade de conhecimento por um tempo limitado. Os dados não podem ser enviados para pessoal não autorizado ou fora da empresa.
Restrito Os dados só podem ser partilhados com pessoas nomeadas que sejam responsáveis pela sua proteção. Por exemplo, documentos legais ou segredos comerciais.

Esquema de classificação de retenção do ciclo de vida dos dados

Retenção Description
None Os dados podem ser apagados a qualquer momento.
Temporário Guarde os dados por um curto período de tempo. Por exemplo, mantenha os dados do Twitter por uma semana.
Período fixo Guarde os dados durante um determinado número de anos, findos os quais podem ser eliminados. Por exemplo, manter registos fiscais durante sete anos para cumprir as leis governamentais.
Permanente Nunca apague dados. Por exemplo, a correspondência jurídica.

É necessário automatizar o processo de classificação de confidencialidade e retenção do ciclo de vida dos dados usando as classes definidas em cada esquema para rotular dados de forma consistente em todo o cenário de dados distribuídos. A automação permite que ele seja governado de forma consistente e correta. Em seguida, defina regras e políticas para cada classe no esquema de classificação para especificar como governar os dados de acordo com sua classificação.

Funções e responsabilidades de governança de dados

Outro requisito é a necessidade de prestação de contas. Caso contrário, persiste a confusão sobre quem é responsável pela gestão dos dados. Se não houver prestação de contas, como responder às seguintes perguntas?

  • Quem define métricas de sucesso e monitora o funcionamento do programa de governança de dados?
  • Quem são os proprietários dos dados?
  • Quem define e mantém um glossário de negócios?
  • Quem cria e mantém políticas de segurança de acesso?
  • Quem está protegendo a privacidade dos dados pessoais para fins de conformidade?
  • Quem cuida da qualidade dos dados dos produtos em todas as brochuras e sites parceiros?
  • Quem garante que os dados dos clientes são consistentes em todos os sistemas?
  • Quem está policiando o uso de dados de assinatura externa versus a licença?
  • Quem está policiando usuários privilegiados, como administradores de banco de dados e cientistas de dados?
  • É um executivo C-level? É um chefe de departamento?
  • É o chefe de governança, risco e conformidade?
  • E o departamento jurídico?
  • É responsabilidade da TI?

Papéis e responsabilidades são necessários para evitar confusões e estabelecer a base sobre a qual uma cultura de dados pode se materializar.

Processos de governança de dados

Os processos são necessários, juntamente com funções e responsabilidades, para:

  • Governar a definição e manutenção de um vocabulário empresarial comum.
  • Descubra e identifique quais dados você tem, o que significa e onde estão armazenados.
  • Classifique os dados para saber como governá-los.
  • Governar a definição e manutenção de políticas de segurança de acesso a dados.
  • Governar a definição e manutenção das políticas de privacidade de dados.
  • Detete problemas de qualidade de dados e corrija-os.
  • Aplique políticas para garantir que sejam tomadas medidas para fins de conformidade.
  • Gerir a manutenção de dados principais.

Políticas e regras de governança de dados

Definir políticas e regras para governar:

  • Regras de integridade dos dados
  • Políticas e regras de ingestão de dados
  • Políticas e regras de segurança de acesso a dados
  • Políticas e regras de privacidade de dados
  • Políticas e regras de qualidade de dados
  • Políticas e regras de manutenção de dados
  • Políticas e regras de retenção de dados

Associe essas políticas e regras a cada classe nos esquemas de classificação de governança de dados.

Gestão de dados mestres

Outro requisito no controle de dados é o gerenciamento de dados mestres. Os dados mestre são os dados mais amplamente compartilhados em qualquer organização e incluem entidades de dados principais. As entidades de dados principais incluem cliente, fornecedor, materiais, funcionário e ativo. Também inclui dados do plano de contas financeiros que são encontrados em diferentes aplicações financeiras. Como os dados mestre são amplamente compartilhados, eles são agnósticos em relação ao aplicativo. É necessário tanto para aplicações operacionais de processamento de transações como para sistemas analíticos. Manter esses dados sincronizados pode resolver muitos erros de dados e erros de processo. Assim, mantê-lo centralmente através de um processo comum e sincronizar todos os sistemas que precisam dele é a situação ideal. Além disso, é necessária governança sobre quem pode mantê-la e onde essa manutenção precisa acontecer.

O mesmo se aplica aos dados de referência, como conjuntos de códigos e dados dos mercados financeiros. Neste caso, a padronização e sincronização de conjuntos de códigos são conhecidas como gerenciamento de dados de referência, que também é um requisito.

Linhagem de metadados

Finalmente, há um requisito para a linhagem de metadados. Você pode usar uma trilha de auditoria para saber onde os dados se originaram e como eles foram transformados a caminho de um relatório ou armazenamento de dados. Você pode usar metadados para rastrear quem ou o que está mantendo os dados, incluindo quando e onde eles ocorrem.

Resumo do que é necessário para a governança de dados de ponta a ponta

Você precisa de uma solução completa que possa controlar os dados durante todo o seu ciclo de vida em armazenamentos de dados na borda, em várias nuvens e no datacenter.

Diagrama da estrutura de governança de dados.

Sua solução de governança de dados deve ter vários componentes:

  • Uma visão e uma estratégia de governança de dados
  • Os dados em si, como dados de clientes, dados de fornecedores, dados de pedidos e outros
  • O ciclo de vida dos dados, desde a criação até a destruição, dentro do qual os dados precisam ser controlados
  • Funções e responsabilidades de governança de dados (pessoas)
  • Processos e atividades de governança de dados e como eles se aplicam ao ciclo de vida dos dados
  • Políticas e regras para controlar dados em diferentes pontos do ciclo de vida
  • Tecnologias de governança de dados para ajudar a tornar possível a governança de dados

Próximos passos