Descrever o Catálogo de Dados do Microsoft Purview
O objetivo do Microsoft Purview Data Catalog é fornecer uma plataforma para governança de dados e impulsionar a criação de valor de negócios em sua organização. Ele faz isso por meio de um rico conjunto de recursos que se alinham aos princípios de governança de dados. As seções a seguir descrevem alguns dos principais recursos do Catálogo de Dados do Microsoft Purview.
Domínios de governação
Domínios de governança: Os domínios de governança são uma nova maneira de organizar seu patrimônio de dados por meio de conceitos de negócios, como Marketing ou Finanças, fornecendo contexto para seus ativos de dados. Um domínio de governança é um limite que permite a governança, a propriedade e a descoberta comuns de produtos de dados e conceitos de negócios, como termos de glossário, OKRs ou dados críticos. Você pode estabelecer muitos tipos de limites, tais como:
- Áreas de negócio fundamentais - recursos humanos, vendas, finanças, supply chain, etc.
- Áreas temáticas abrangentes - produto, festas, etc.
- Limites baseados em funções organizacionais - experiência do cliente, cadeia de suprimentos em nuvem, business intelligence, etc.
Os domínios de negócios estão conectados a vários outros conceitos de negócios que são incorporados como recursos do Catálogo de Dados.
Produtos de dados
Relacionados a domínios de negócios são produtos de dados. Um produto de dados é uma construção de negócios com um nome, descrição, proprietários e, mais importante, uma lista de ativos de dados associados. O produto de dados fornece contexto para os ativos incluídos nele e fornece um caso de uso para consumidores de dados.
Um domínio de governança pode abrigar muitos produtos de dados, mas um produto de dados é gerenciado por um único domínio de governança e pode ser descoberto em vários domínios.
Um produto de dados bem-sucedido torna mais fácil para os consumidores de dados reconhecerem dados valiosos usando sua linguagem diária e, ao mesmo tempo, simplifica as responsabilidades de propriedade desses ativos de dados.
Considere o exemplo em que um cientista de dados criou um conjunto de ativos de dados para ser usado por um modelo de dados e para ser usado por outros. Embora o cientista de dados possa usar o catálogo de dados para adicionar um termo de glossário a todos os ativos de dados relevantes e possa adicionar uma descrição a cada ativo para torná-lo mais relevante na busca de informações semelhantes, isso não garante que um consumidor de dados saiba qual termo de glossário usar ou que o consumidor de dados encontrará todos os ativos de dados. É aqui que um produto de dados se encaixa bem. O cientista de dados cria um produto de dados que lista todos os ativos usados para criar seu modelo de dados. A descrição fornece um caso de uso completo, com exemplos ou sugestões sobre como usar os dados. O cientista de dados agora é proprietário de um produto de dados e melhorou a experiência de pesquisa do consumidor de dados, ajudando-o a obter tudo o que precisa neste único produto de dados.
Termos do glossário
Os termos do glossário fornecem contexto de negócios crítico para seus ativos de dados e também aplicam políticas que determinam como seus dados devem ser gerenciados, controlados e tornados detetáveis para uso.
Os termos do glossário são conceitos individuais que definem os negócios, processos e sistemas usados em uma organização. Eles podem ser aplicados em uma propriedade de dados, relacionados a ativos de dados e produtos de dados para fornecer contexto de negócios aos seus usuários.
Os termos são criados em domínios de governança para criar um contexto específico para cada parte da sua organização. Por exemplo, vendas e marketing podem usar o mesmo termo para significar coisas diferentes, e seus domínios de governança ajudam sua equipe a diferenciar esses significados. Uma vez criados, os termos são mapeados para produtos de dados, para fornecer contexto para esses produtos de dados e para fornecer governança de dados específica com base no contexto de negócios.
Os termos do glossário fornecem governança de dados com base no contexto de negócios, porque agora contêm políticas. As políticas em um termo de negócios aplicam metas específicas de integridade de negócios, requisitos de governança de dados e termos de uso a qualquer produto de dados ao qual um termo seja aplicado.
Elementos de dados críticos
Nem todos os elementos de dados têm a mesma importância ou sensibilidade, e dedicar recursos para gerenciar a qualidade de todos os dados indiscriminadamente pode ser impraticável e dispendioso. Os elementos de dados críticos (CDEs) são um agrupamento lógico de informações importantes em todo o seu conjunto de dados. Esses agrupamentos podem facilitar a compreensão dos dados e promover a padronização. As regras de qualidade de dados e as políticas de acesso podem ser anexadas a esses elementos para proteger ainda mais as informações confidenciais em todo o seu conjunto de dados.
Por exemplo: um elemento de dados crítico "ID do cliente" pode mapear "CustID" de uma tabela e "CID" de outra tabela para o mesmo contêiner lógico. Os usuários podem corresponder esse valor entre ativos de dados para fazer conexões e, quando os produtores de dados criam um novo ativo, podem usar esse elemento como um modelo para fornecer informações de qualidade no formato correto.
Os elementos de dados críticos são criados dentro de domínios de governança e podem ter políticas definidas para gerenciar essas informações importantes.
Ao criar CDEs, as organizações podem alocar recursos estrategicamente, concentrando o esforço de governança nas áreas que têm o impacto mais significativo no negócio.
OKRs
OKRs (objetivos e resultados-chave) no Microsoft Purview são objetivos de negócios rastreáveis vinculados a domínios de governança e produtos de dados para enfatizar o valor dos dados corporativos.
Os OKRs vinculam produtos de dados diretamente a objetivos de negócios reais para cruzar a lacuna entre o negócio e o patrimônio de dados. A governança de dados não é apenas uma tarefa de TI ou uma prática recomendada de engenharia, é uma parte crítica da geração de valor.
Políticas de acesso a dados
As políticas de acesso ao catálogo de dados permitem que você gerencie o acesso aos seus produtos de dados e configure um sistema para fornecer acesso aos usuários que o solicitarem. Promova a inovação e a flexibilidade em seu patrimônio de dados criando oportunidades de acesso de autosserviço, ao mesmo tempo em que mantém os padrões de segurança e uso correto.
Pesquisar e navegar
A descoberta de dados pode ser demorada porque você pode não saber onde encontrar os dados desejados. A pesquisa permite que os consumidores encontrem facilmente os dados necessários para suas cargas de trabalho de análise ou governança. A pesquisa é ótima se você souber o que está procurando, mas há momentos em que os consumidores de dados desejam explorar os dados disponíveis para eles. O Catálogo de Dados do Microsoft Purview oferece uma experiência de navegação que permite aos utilizadores explorar os dados que têm disponíveis através da recolha ou ao percorrerem a hierarquia de cada origem de dados no catálogo.
Gestão em saúde
A gestão de saúde tem recursos para aprimorar sua estratégia e gerenciamento de governança de dados.
Controles de integridade: os controles de integridade de dados permitem que sua equipe analise e acompanhe sua jornada para concluir a governança de dados monitorando a integridade da governança e usando os controles de integridade fornecidos para acompanhar seu progresso. Os Controles de Integridade de Dados são medidas, processos e ferramentas específicos implementados para monitorar, manter e melhorar a qualidade, a segurança e a integridade geral dos dados de uma organização.
Os benefícios dos controles de integridade de dados incluem:
- Melhor qualidade dos dados: garante que os dados permaneçam precisos, consistentes e confiáveis para a tomada de decisões.
- Segurança aprimorada: protege dados confidenciais contra violações, acesso não autorizado e corrupção.
- Conformidade regulamentar: Ajuda as organizações a aderir aos padrões legais e do setor para gerenciamento de dados.
- Eficiência operacional: reduz o tempo e os recursos gastos na correção de problemas de dados e garante que os dados estejam prontamente disponíveis e utilizáveis.
- Mitigação de riscos: evita erros dispendiosos e riscos relacionados a dados que podem surgir de um mau gerenciamento de dados.
Em resumo, os controles de integridade de dados são componentes essenciais de uma estratégia abrangente de governança de dados, ajudando as organizações a manter a integridade, a segurança e a usabilidade de seus ativos de dados.
Ações de saúde: as ações de gerenciamento de saúde fornecem a você e aos usuários as etapas a serem tomadas para melhorar a integridade e a governança dos dados em todo o seu conjunto de dados. Essas ações correspondem às verificações feitas para calcular a pontuação de controle de integridade da governança de dados de um produto de dados. Abordar essas ações aumenta sua pontuação de saúde e promove um catálogo de dados geral mais utilizável e detetável.
Qualidade de dados
O Microsoft Purview Data Quality é uma solução abrangente que capacita os proprietários de domínios de governança e dados a avaliar e supervisionar a qualidade de seu ecossistema de dados, facilitando ações direcionadas para melhoria.
O Data Quality oferece aos usuários a capacidade de avaliar a qualidade dos dados usando regras no-code/low-code, incluindo regras prontas para uso (OOB) e regras geradas por IA. Essas regras são agregadas para fornecer pontuações nos níveis de ativos de dados, produtos de dados e domínios de governança, garantindo visibilidade de ponta a ponta da qualidade dos dados em cada domínio. O Microsoft Purview Data Quality também incorpora recursos de criação de perfil de dados alimentados por IA
Ao aplicar o Microsoft Purview Data Quality, as organizações podem medir, monitorar e melhorar efetivamente a qualidade de seus ativos de dados.