Compartilhar via


Configuração de exemplo para governação de dados

A governação de dados do Microsoft Purview, com Catálogo unificado do Microsoft Purview e Mapa de Dados do Microsoft Purview, proporciona visibilidade abrangente, confiança nos dados e inovação responsável para ajudar as organizações a alcançar um maior valor comercial na era da IA. Com um exemplo de gestão de dados de estado de funcionamento, siga os passos neste artigo para o ajudar a compreender como configurar Catálogo unificado e utilizar a respetiva funcionalidade para criar uma boa prática de governação de dados para a sua organização.

Passo 1: Configurar os domínios de governação no Catálogo unificado

Os domínios de governação são a chave para estabelecer responsabilidade pelos seus dados e ajudarão a federar a governação desses dados em toda a empresa. Quando cria domínios de governação, começar com o proprietário adequado garante que consegue identificar e colaborar eficazmente com especialistas para todos os dados no património de dados. Os domínios de governação podem ser muitos tipos diferentes para alinhar com o tipo de limite de dados para a equipa que irá governar esses dados. Por exemplo: domínios funcionais (finanças, RH, vendas) ou domínios de dados (produto, cliente, estado de funcionamento).

Pré-requisitos

Conceder permissões e criar o primeiro domínio de governação

  1. Abra o portal do Microsoft Purview.

  2. Inicie sessão no portal do Microsoft Purview com a credencial de uma conta de administrador à qual é atribuída a função de Gestão de funções (por exemplo, um administrador do Purview). Aceda a Definições > Funções e âmbitos para ver e gerir.

  3. Selecione Grupos de funções.

  4. Na página Grupos de funções para soluções do Microsoft Purview , selecione o grupo de funções Governação de Dados .

  5. Na página Editar membro do grupo de funções, selecione Escolher utilizadores ou Escolher grupos.

  6. Selecione a caixa de marcar para todos os utilizadores ou grupos que pretende adicionar ao grupo de funções.

  7. Selecione Selecionar.

  8. Em Catálogo unificado, selecione Gestão do catálogo e, em seguida, domínios de governação.

  9. Na página Domínios de governação , pode configurar o resto do catálogo para permitir que outras pessoas federam a propriedade dos dados, capacitem as equipas para desenvolverem os seus conhecimentos e estabelecerem o valor comercial dos seus dados.

    1. Comece por selecionar Novo domínio de governação.
      1. Pode atualizar o nome do seu domínio de governação, mas, para isso, podemos dar-lhe o nome "(Tutorial) Personal Health" e dar-lhe uma descrição de "Os dados de saúde pessoal referem-se a todas as informações relacionadas com a saúde física ou mental de um indivíduo que são recolhidas e utilizadas no setor da saúde. Isto pode incluir uma vasta gama de tipos de dados, como registos médicos, históricos de tratamento, imagens de diagnóstico e resultados de testes laboratoriais. É muitas vezes protegido ao abrigo de várias leis e regulamentos para garantir privacidade e confidencialidade."
      2. Selecione o tipo como um "domínio de dados".
      3. Deixe o elemento principal em branco (se este for o primeiro domínio de governação no catálogo, não terá nada para selecionar aqui)
      4. Selecione Criar
      5. Agora, crie mais dois domínios sozinho. Estes serão pontos-chave de federação para colaboração e governação na sua própria organização, por isso, pense em quem poderá ser o proprietário dos seus domínios quando implementar Catálogo unificado do Microsoft Purview.
        1. Pode seguir estes exemplos:
        • Um domínio funcional empresarial representa os recursos e termos altamente controlados que uma empresa inteira utiliza.
        • Sales é um domínio funcional que a maioria das organizações terá que é um domínio subordinado da empresa.
  10. Selecione o domínio de governação criado.

  11. Selecione o separador Funções do domínio de governação.

  12. Por predefinição, quando cria o domínio de governação, é adicionado a todas as funções no domínio de governação. Enquanto proprietário de um domínio de governação, adiciona os responsáveis pelos dados (especialistas empresariais no seu domínio) e os proprietários de produtos de dados (que sabem quais os recursos de dados que são os melhores para outras pessoas consumirem).

  13. Regresse ao separador Detalhes .

  14. Selecione o botão Gerir políticas para aplicar uma política ao nível do domínio. Esta política será aplicada a todos os produtos de dados no domínio, o que permite que a aplicação automática de uma política garanta que os especialistas em dados também não têm de ser especialistas em políticas.

  15. No separador Gerir políticas de acesso , selecione a caixa de verificação junto a Permitir cópias de dados. Ao selecionar esta opção de política, aplicará automaticamente um atestado que exige que todos os utilizadores que peçam acesso aos seus produtos de dados atestam que compreendem a política de cópia de dados para os seus dados.

  16. Selecione Guardar alterações para confirmar que a política está definida pelo domínio de governação.

  17. Selecione Publicar no domínio de governação. O botão Publicar publica todos os outros conceitos no domínio.

Criar termos do glossário

Adicionar termos do glossário ao seu domínio de governação permite que outras pessoas compreendam melhor como a empresa utiliza e compreende os dados. Os termos do glossário também garantem que as informações utilizam termos comuns e, geralmente, os seus conhecimentos em todo o seu domínio de governação.

  1. Na página do seu domínio de governação, localize os termos do Glossário card e selecione Ver tudo.

  2. Na página Termos do glossário , selecione Novo termo.

  3. Introduza os detalhes:

    1. Nome: "Surto"
    2. Descrição: uma doença que afetou ou tem o potencial de afetar uma grande parte da população.
    3. Por agora, pode deixar o resto em branco, mas existem campos a recolher: o proprietário do termo responsável por definir o termo para a sua empresa, acrónimos para partilhar também comuns, também conhecidos como nomes do termo, por último, pode fornecer ligações para os recursos que teriam ainda mais informações sobre o termo.
  4. Selecione Criar

  5. Selecione o botão Gerir Políticas . À semelhança das políticas ao nível do domínio, pode criar políticas de nível de termos que serão aplicadas sempre que o termo em utilização.

  6. Selecione a caixa junto a Aprovação do gestor necessária. Isto impõe uma aprovação secundária dos utilizadores listados no Microsoft Entra ID quando é pedido acesso aos produtos de dados.

  7. Selecione Publicar para o termo Surto criado. Os termos publicados serão filtráveis no Catálogo unificado e garantirão que outras pessoas que utilizem o termo para descrever o respetivo produto de dados poderão ver essa descrição no Catálogo unificado enquanto navegam no produto de dados.

  8. Agora, crie mais dois termos. Desta vez, selecione o termo "Surto" como o termo principal para os termos que criou. Experimente criar relações entre estes termos subordinados no separador relacionado em qualquer um dos termos para ajudar a criar a rede de como estes termos funcionam em conjunto para explicar a totalidade de um tópico.

    1. Pandemia: Um surto global de uma doença que afeta um grande número de pessoas em vários países ou continentes.
    2. Epidemia: Um surto nacional ou regional de uma doença que é altamente contagiosa e afeta uma grande parte da população.
  9. Experimente criar alguns outros termos em quaisquer outros domínios que tenha criado anteriormente. Se não tiver a certeza do que adicionar, experimente o botão Obter termos sugeridos para que a GenAI proponha alguns com base na descrição e no nome do domínio que já forneceu.

Adicionar um OKR

Agora, adicione um OKR (objetivo e resultado chave) para o seu domínio de Saúde Pessoal para ajudar outras pessoas a compreender o valor comercial dos seus dados. Esta ação criará uma ligação direta entre os seus dados e o valor comercial que fornece.

  1. Selecione a caixa OKR na página do domínio de governação.

  2. Selecione Novo OKR.

  3. Introduza primeiro os detalhes do objetivo:

    1. Objetivo: reduza o risco de pandemia ao permitir a aceitação eficaz da vacina contra o paciente.
    2. Proprietário: introduza o seu nome
    3. Data de destino: "2024-12-31"
  4. Selecione Criar

  5. Adicionar resultados importantes ao seu objetivo garante que os objetivos são mensuráveis e que o progresso para o objetivo é monitorizado. Selecione + Adicionar resultado da tecla.

  6. Introduza os Detalhes do resultado da chave:

    1. Resultado principal: certifique-se de que 80% das faixas etárias mais velhas (>65 anos) que são mais prováveis de serem afetadas pela pandemia recebem vacinação total até ao final do ano civil de 2024.
    2. Progresso status: No caminho certo
    3. Montante do Progresso: 70
    4. Valor do objetivo: 80
    5. Montante máximo: 100
  7. Selecione Criar.

  8. Selecionar Publicar.

Criar elementos de dados críticos

Por fim, crie um elemento de dados crítico (CDE) no Estado de Funcionamento Pessoal para garantir que as colunas de dados mais importantes têm uma definição consistente, compreensão e que cumprem sempre as expectativas da empresa relativamente à forma como esses dados são formados e armazenados.

  1. Na página domínios de governação com o domínio Estado de Funcionamento Pessoal selecionado, selecione a caixa Elementos de dados críticos .
  2. Selecione Novo elemento de dados críticos.
  3. Introduza os metadados básicos do CDE:
    1. Nome: Grupos etários
    2. Descrição: o agrupamento comum de idades de pessoas utilizado para garantir que os relatórios analíticos necessários seguem uma referência de que outras pessoas podem depender e remover idades individuais para melhorar o anonimato dos dados. O grupo etário está dividido em 8 grupos; <2 anos, 2-4 anos, 5-11 anos, 12-17 anos, 18-24 anos, 25-49 anos, 50-64 anos, mais 65 anos.
    3. Proprietário: introduza o seu nome
    4. Tipo de Dados Esperado: Texto
    5. Selecione Criar

O poder real do CDE é que mapeia diretamente para as colunas de dados físicos onde estes dados são armazenados. Esta ligação garante uma compreensão comum e permite a avaliação de regras e políticas de Qualidade de Dados em escala.

  1. No CDE que acabou de criar, selecione + Adicionar coluna.

  2. Procure o recurso de dados Covid 19 Vaccine and Case Trends do contentor dourado do data lake

  3. Selecione a caixa, não o nome, do recurso Covid 19 Vaccine and Case Trends .

    Dica

    Se selecionar o nome azul do recurso, será aberta uma nova janela no Microsoft Purview a mostrar-lhe os detalhes do recurso.

  4. Selecione o botão de opção junto à coluna AgeGroupVacc.

  5. Selecione Adicionar.

  6. Selecione o separador Qualidade dos dados na parte superior da CDE que acabou de criar para aplicar regras de qualidade de dados à CDE. É semelhante à forma como adicionou políticas para termos do glossário e domínios de governação.

  7. Selecionar Nova regra

  8. Selecionar Correspondência de tipo de dados

  9. Introduzir Nome da regra: Confirmar formatação do grupo Etário

  10. Selecione Criar

  11. Selecione Publicar no CDE

Esta CDE irá agora aplicar automaticamente uma regra de qualidade de dados a todos os produtos de dados que utilizem o recurso Covid 19 Vaccine and Case Trends, que iremos abordar na próxima secção.

  1. Experimente criar alguns outros CDEs nos seus outros domínios. Seguem-se algumas ideias:
    • Vendas: Receita e Nome do Vendedor
    • Empresa: ID do Produto

Passo 2: Configurar e registar os seus dados no Mapa de Dados

Se não tiver origens de dados disponíveis para análise, pode seguir estes passos para implementar totalmente um exemplo de Azure Data Lake Storage (ADLS Gen2).

Dica

Se já tiver uma origem de dados no mesmo inquilino que a sua conta do Microsoft Purview, avance para a próxima parte desta secção para analisar os seus recursos.

Num imobiliário, encontra muitos sistemas diferentes em utilização para diferentes aplicações de dados. Existem ambientes de relatórios como Recursos de Infraestrutura e Snowflake onde as equipas utilizam cópias de dados para criar soluções analíticas e alimentar os seus relatórios e dashboards. Existem sistemas de dados operacionais que alimentam as equipas ou os clientes das aplicações para concluir processos empresariais que recolhem ou adicionam dados com base nas decisões tomadas durante o processo.

Para criar um património de dados mais realista, a recomendação é mostrar muitas origens de dados no catálogo, que podem abranger a amplitude de utilizações de dados diferentes que qualquer empresa possa ter. Os tipos de dados necessários para alimentar um caso de utilização podem ser muito diferentes com os utilizadores empresariais que precisam de relatórios e dashboards, os analistas precisam de dimensões e factos em conformidade para criar relatórios, cientistas de dados ou engenheiros de dados precisam de dados de origem não processados provenientes diretamente do sistema que recolhe todos estes dados e mais permitem que diferentes utilizadores vejam a importância de encontrar, compreender e aceder a dados no mesmo local.

Para outros tutoriais para adicionar dados ao seu património, pode seguir estes guias:

Pré-requisitos

  • Subscrição no Azure: Criar a Sua Conta Gratuita do Azure Hoje
  • Microsoft Entra ID do seu inquilino: Microsoft Entra ID Governance
  • Uma Conta do Microsoft Purview
    • Administração acesso à conta do Microsoft Purview (esta é a predefinição se tiver criado a conta do Microsoft Purview. Permissões na nova pré-visualização do portal do Microsoft Purview | Microsoft Learn)
  • Todos os recursos; O Microsoft Purview, a sua origem de dados e Microsoft Entra ID têm de estar no mesmo inquilino da cloud.

Configurar o seu património de dados

A. Criar e preencher uma conta de armazenamento
  1. Siga este guia para criar uma conta de armazenamento: Criar uma conta de armazenamento para Azure Data Lake Storage Gen2
  2. Crie contentores para o seu novo data lake:
    1. Navegue para a página Descrição geral da nossa Conta de Armazenamento.
    2. Selecione o separador Contentores na secção Armazenamento de dados.
    3. Selecione o botão + Contentor
    4. Atribua o nome "bronze" e selecione o botão Criar
    5. Repita estes passos para criar um contentor "gold"
  3. Transfira alguns dados CSV de exemplo do data.gov: Vacinação Covid-19 E Tendências de Casos por Grupo Etário, Estados Unidos
  4. Carregue o CSV para o contentor com o nome "bronze" na conta de armazenamento que criou.
  5. Selecione o contentor com o nome "bronze" e selecione o botão Carregar .
  6. Procure a localização onde guardou o CSV e selecione o ficheiro covid-19_Vaccination_Case _Trends .
  7. Selecione Carregar.
B. Criar um Azure Data Factory

Este passo irá demonstrar como os dados se movem entre camadas de um data lake de medalhão e garantir que os dados estão num formato padronizado que os consumidores esperam utilizar. Este é um passo de pré-requisito para executar a Qualidade dos Dados.

  1. Siga este guia para criar um Azure Data Factory: Criar um Azure Data Factory

  2. Copie os dados do CSV no contentor "bronze" para o contentor "gold" como uma tabela de formato Delta com este guia de Azure Data Factory: Transformar dados com um fluxo de dados de mapeamento

  3. Abra a experiência Azure Data Factory (ADF) a partir do portal do Azure ao selecionar o botão Iniciar estúdio no separador Descrição geral do recurso do ADF criado.

  4. Selecione o separador Autor no estúdio do ADF.

  5. Selecione o + botão e escolha Fluxo de dados no menu pendente.

  6. Atribua o nome "CSVtoDeltaC19VaxTrends" ao fluxo de dados.

  7. Selecione Adicionar Origem na caixa vazia.

  8. Defina Definições de origem como:

    1. Nome do fluxo de saída: "C19csv"
    2. Descrição: deixe em branco
    3. Tipo de origem: Inline
    4. Tipo de conjunto de dados inline: Texto Delimitado
    5. Serviço Ligado: selecione o data lake onde armazenou o csv
  9. Defina opções de Origem como:

    1. Modo de ficheiro: Ficheiro
    2. Caminho do ficheiro: /bronze/ Covid-19_Vaccination_Case _Trends
    3. Não permitir ficheiros encontrados: deixe desmarcado
    4. Captura de dados alterados: deixar desmarcada
    5. Tipo de compressão: Nenhum
    6. Codificação: Predefinição(UTF-8)
    7. Delimitador de colunas: Vírgula (,)
    8. Delimitador de linhas: Predefinição(\r, \n ou\r\n)
    9. Caráter de aspas: aspas duplas (")
    10. Caráter de escape: Barra invertida ()
    11. Primeira linha como cabeçalho: SELECIONADO
    12. Deixe o resto como predefinições
  10. Selecione o pequeno + Junto à origem criada e selecione Sink

  11. Crie o sink onde o formato e a localização dos dados a armazenar para mover os dados de um csv em "bronze" para uma tabela delta em "gold".

    1. Defina os valores sink (deixe todas as definições como predefinição, a menos que seja especificado)
    2. Tipo de sink: Inline
    3. Tipo de conjunto de dados inline: Delta
    4. Serviço ligado: o mesmo data lake utilizado na origem, porque vamos armazenar num contentor diferente.
  12. Defina os Valores de definição (deixe todas as definições como predefinição, a menos que seja especificado)

    1. Caminho da pasta: Gold/Covid19 Vaccine and Case Trends
  13. Tem de introduzir o valor porque este nome é a forma como queremos que os dados sejam armazenados e não existem para selecionar.

  14. Selecione Validar, esta ação verifica o fluxo de dados e fornece instruções para corrigir eventuais erros.

  15. Selecione Publicar tudo.

  16. Selecione o + botão e selecione pipeline no menu pendente

  17. Atribua o nome "CSV ao Delta C19 Vax Trends" ao pipeline

  18. Selecione o fluxo de dados criado nos passos anteriores CSV para Delta (C19VaxTrends) e arraste e largue-o no separador de pipeline aberto.

  19. Selecione Validar

  20. Selecione Publicar

  21. Selecione Depurar (utilizar o runtime de atividade) para executar o pipeline.

    Dica

    Se ocorrerem erros em espaços ou carateres inadequados para o formato delta: abra o CSV transferido e faça correções. Em seguida, volte a carregar e substitua o CSV na zona de bronze. Em seguida, volte a executar o pipeline.

  22. Navegue para o contentor gold no data lake e deverá agora ver a nova tabela Delta criada durante o pipeline.

Analisar os recursos

Se ainda não analisou recursos de dados no seu Mapa de Dados do Microsoft Purview, pode seguir estes passos para preencher o mapa de dados.

A análise de origens no seu património de dados recolherá automaticamente os metadados dos recursos de dados (tabelas, ficheiros, pastas, relatórios, etc.) nessas origens. Ao registar uma origem de dados e ao criar a análise, estabelece a propriedade técnica sobre as origens e recursos que são apresentados no catálogo e garante que tem controlo sobre quem pode aceder aos metadados no Microsoft Purview. Ao registar e armazenar origens e recursos ao nível do domínio, serão armazenados no nível mais elevado da hierarquia de acesso. Normalmente, é melhor criar algumas coleções onde irá analisar os metadados do recurso e estabelecer a hierarquia de acesso correta para esses dados.

Se optou por utilizar o Microsoft Fabric ou o SQL, pode utilizar estes guias para fornecer acesso:

Registar o data lake e analisar os seus recursos

  1. No Mapa de Dados do Microsoft Purview no separador domínios, selecione as Atribuições de funções para o domínio (será o nome da conta do Microsoft Purview):

    1. Adicione-se como administrador da origem de dados e curador de dados ao domínio.
      1. Selecione o ícone de pessoa junto à função Administrador da origem de dados.
      2. Pesquise o seu nome tal como está no Microsoft Entra ID (pode exigir que introduza o seu nome completo escrito exatamente como está no Microsoft Entra ID).
      3. Selecione OK.
      4. Repita estes passos para o curador de dados.
  2. Registar o data lake:

    1. Selecione o separador Origens de dados .
    2. Selecione Registrar.
    3. Selecione o tipo de armazenamento Azure Data Lake Storage Gen2.
  3. Indique os detalhes para ligar:

    1. Subscrição (opcional)
    2. Nome da Origem de Dados (este será o nome da origem do ADLS Gen2)
    3. Coleção onde os metadados de recursos devem ser armazenados (opcional)
    4. Selecione Registar
  4. Assim que o registo da origem de dados estiver concluído, pode configurar a análise. O registo significa que o Microsoft Purview está ligado à origem de dados e colocou-o na coleção correta para propriedade. Em seguida, a análise irá ler os metadados da origem e preencher os recursos no mapa de dados.

  5. Selecione a origem que registou no separador origens de dados

  6. Selecione nova análise e forneça os detalhes:

    1. Utilizar o runtime de integração predefinido para esta análise
    2. A credencial deve ser MICROSOFT Purview MSI (sistema)
    3. O nível de análise é Deteção Automática
    4. Selecione uma coleção ou utilize o domínio (a coleção tem de ser a mesma coleção ou coleção subordinada do local onde a origem de dados foi registada)
    5. Selecione Continuar

    Dica

    Neste momento, o Microsoft Purview irá testar a ligação para validar uma análise. Se não tiver concedido acesso ao leitor MSI do Microsoft Purview na origem de dados, este falhará. Se não for o proprietário da origem de dados ou tiver acesso de utilizador contribuidor a análise falhará, uma vez que espera ter autorização para criar a ligação.

  7. Agora, selecione apenas o contentor "gold" onde colocámos a tabela delta na secção building data do tutorial. Isto impedirá a análise de quaisquer outros recursos de dados que estejam no arquivo de dados.

    1. Se tiver apenas um marcar azul junto a ouro, pode deixar verificações junto a tudo, uma vez que analisará a origem completa e ainda criará os recursos que iremos utilizar e muito mais.
    2. Selecione Continuar
  8. No ecrã selecionar um conjunto de regras de análise, deve utilizar o conjunto de regras de análise predefinido.

  9. Selecione Continuar

  10. Ao definir um acionador de análise, irá definir a frequência da análise para que, à medida que continuar a adicionar recursos de dados ao contentor dourado do lago, continue a preencher o mapa de dados. Selecione Uma Vez.

  11. Selecione Continuar.

  12. Selecione Guardar e Executar. Esta ação irá criar uma análise que só irá ler os metadados do contentor dourado do data lake e preencher a tabela que iremos utilizar no Catálogo unificado do Microsoft Purview nas secções seguintes. Se selecionar guardar apenas, este não executará a análise e não verá os recursos. Assim que a análise estiver em execução, verá a análise que criou com uma Última execução status de Colocação em Fila. Quando a leitura da análise estiver concluída, os recursos estão prontos para a secção seguinte. Esta operação pode demorar alguns minutos ou horas consoante o número de recursos que tem na sua origem.

Passo 3: publicar os seus produtos de dados

A criação de produtos de dados é essencial para garantir que os dados certos são detetáveis pela sua organização. Os produtos de dados ajudarão a impedir a governação de dados baixos ou sem valor no seu património de dados, uma vez que não têm qualquer utilização ou valor limitado. Garantir que os seus especialistas em dados estão prestes a publicar produtos de dados ativará os seus dados mais valiosos e criará o nível certo de governação com base nesse valor. A curadoria de ativos que as equipas técnicas não conhecem o objetivo comercial de ou que tentam governar tudo no seu complexo e crescente património de dados causará tempo extra e perderá a produtividade perseguindo os detalhes dos dados que podem nunca ser utilizados ou que podem simplesmente ser removidos da propriedade. Em vez disso, concentre-se nas partes de dados que têm valor e que as pessoas precisam de descobrir e construir ainda mais valor. À medida que as equipas utilizam mais dados e compreendem melhor o que é necessário ou podem ser criados produtos de dados mais úteis para satisfazer essas exigências e a governação pode adaptar-se para garantir que mantém sempre o tamanho certo com base no valor e sensibilidade dos dados.

Pré-requisitos

Criar e publicar um produto de dados

  1. Abra o portal do Microsoft Purview.

  2. Selecione Catálogo unificado.

  3. Selecione Gestão do catálogo e , em seguida, Domínios de governação.

  4. Na página Domínios de governação , selecione o domínio Estado de Funcionamento Pessoal

  5. Selecione a ligação Ir para produtos de dados em Conceitos empresariais

  6. Eis onde os especialistas em dados denominados proprietários de produtos de dados identificarão os recursos de dados que se destinam a ser consumidos por outras pessoas na sua organização e fornecerão as informações necessárias para os tornar utilizáveis.

  7. Selecionar Novo produto de dados

  8. Indique detalhes sobre o produto de dados

    1. Nome: "Vacinação Covid-19 e Casos Populares por Idade"
    2. Descrição: "Estes dados vêm do CDC como parte do Departamento de Saúde dos E.U.A. & Serviços Humanos. Os dados contêm tendências de vacinação e casos por faixa etária, a nível nacional dos EUA. Os dados são estratificados por pelo menos uma dose e totalmente vacinados. Os dados também representam todos os parceiros de vacinação, incluindo clínicas de parceiros jurisdicionais, farmácias de retalho, instalações de cuidados de longa duração, centros de diálise, agência federal de gestão de emergência e sites parceiros de Administração de Serviços e Recursos de Saúde, e instalações de entidades federais."
    3. Tipo: Conjunto de Dados
    4. Selecione Avançar
    5. Casos de utilização: "Estes dados são fornecidos para utilização pública e destinam-se a ajudar a compreender as tendências da vacinação e novos casos por diferentes faixas etárias. As idades são listadas em dois grupos que variam entre <os 2 e os 65 anos. Da mesma forma, as tendências são fornecidas em números diários que fornecem uma média de sete dias de novos casos por faixa etária."
    6. Marcar como Endossado como verificado.
    7. Selecione Salvar.
  9. Agora tem os metadados base do produto de dados incorporados. Em seguida, adicione algumas propriedades e mapeie o recurso a partir do mapa de dados.

  10. Selecione o botão + Adicionar recursos de dados .

  11. Verá os recursos que analisou no mapa de dados, o que incluirá todas as pastas e camadas da origem de dados.

  12. Procure o recurso Covid19 Vaccine and Case Trends que adicionou ao contentor dourado do data lake e selecione este conjunto de recursos.

  13. Selecione Adicionar. Pode selecionar o número de recursos necessários para um produto de dados, mas aqui só é necessário um.

    Dica

    Experimente o botão Obter sugestões para que a GenAI ajude a escolher entre os recursos no mapa de dados e selecione As Tendências da Vacina e do Caso Covid19 a partir de uma lista reduzida de resultados.

  14. Agora pode ver o recurso adicionado ao seu produto de dados.

  15. Selecione + Adicionar termo junto ao título dos termos do glossário

  16. Selecione o termo Surto criado anteriormente e selecione Adicionar

  17. Deverá ver o elemento de dados crítico para o grupo etário do recurso mapeado para o produto de dados agora.

  18. Selecione + Adicionar OKR junto ao título da OKR

  19. Selecione Reduzir o risco pandemia ao permitir a aceitação eficaz da vacina contra o paciente. É o objetivo que criámos na primeira secção.

Gerir políticas de pedidos de acesso a produtos de dados

Na parte superior da página, o último passo antes de publicar o produto de dados é selecionar o botão Gerir políticas . Aqui, as políticas de acesso e o fluxo de trabalho de pedido de acesso são configurados ao efetuar seleções e fornecer os nomes para aprovação. Também pode utilizar o separador Políticas herdadas para ver a política de domínio de governação aplicada ao atestado de cópias de dados que aplicámos anteriormente. É o mesmo para a aprovação do Gestor necessária a partir do termo glossário do Surto.

  1. Selecione o separador Gerir políticas .

  2. Em Limite de tempo de acesso, forneça detalhes sobre quanto tempo o pedido de acesso é válido antes de ter de ser renovado. Vamos definir esta opção para conceder acesso até um ano.

  3. Na caixa, coloque 1.

  4. Selecione anos na lista pendente.

  5. Em requisitos de aprovação, indique o seu nome na caixa aprovadores. (Será necessário o nome registado no Microsoft Entra ID)

    Observação

    Não é necessário marcar aprovação do gestor porque essa política é herdada do termo glossário do surto.

  6. Selecione o botão Formulário de pedido de pré-visualização para ver o que os consumidores do catálogo irão ver ao pedir acesso. Verá o atestado de cópia de dados e a aprovação do gestor necessários porque foram definidos pelo domínio de governação e pelo termo do glossário.

  7. Selecionar Salvar alterações.

Assim que tiver os recursos de dados mapeados e as políticas de acesso configuradas, estará pronto para publicar o produto de dados no catálogo.

  1. Selecione Publicar no produto de dados.

  2. Experimente criar um Relatório de Lucro noutros domínios que criou anteriormente

    1. Relatório de Lucro, Tipo: Dashboards/relatórios.
    2. Product Master, Type: Dados de massa e dados de referência.

Observação

Pode adicionar muitos recursos a estes e ver o aspeto de um produto de dados com muitos recursos e os produtos de dados a partir de qualquer domínio para ver como o glossário é utilizado para descrever os dados através de um conjunto consistente de termos.

Passo 4: Executar a qualidade dos dados

Agora que tem um produto de dados disponível no catálogo, a execução de regras de qualidade de dados indicará a todos que os dados estão em boa forma e prontos para serem utilizados. À medida que mais se aprende sobre os dados, podem ser adicionadas novas regras de qualidade de dados para garantir que são adequadas para todos os casos de utilização. Garantir que os produtos de dados têm a mais alta qualidade ajudará a criar confiança nos seus dados e a informar as outras pessoas de que estão a ser monitorizados de forma melhorada. À medida que o valor dos dados aumenta, a qualidade desses dados terá de ser monitorizada e controlada de forma mais detalhada, uma vez que os problemas de qualidade dos dados podem causar enormes impactos se forem mal geridos.

Pré-requisitos

  • As regras de qualidade dos dados só podem ser executadas em tabelas de formato delta no ADLS Gen2 e no Microsoft Fabric.
  • A Identidade Gerida do Microsoft Purview tem de estar ativada para ler a origem de dados, uma vez que é a única credencial suportada para a qualidade dos dados atualmente.
  • Tem de ter a função de responsável pela qualidade dos dados no domínio de governação no qual está a executar a qualidade dos dados.
  • Tem de ser o proprietário ou ter acesso de administrador de acesso de utilizador à origem de dados que está a ligar à análise da qualidade dos dados para garantir uma autorização de segurança adequada para analisar os dados.
  • Tem de ter a função de responsável pelo perfil de dados para executar perfis nos seus dados.

Criar e executar regras de qualidade de dados

  1. Abra o portal do Microsoft Purview.

  2. Selecione Catálogo unificado.

  3. Selecione o separador Qualidade dos dados em Gestão de dados.

  4. Selecione o Domínio de Estado de Funcionamento Pessoal criado na secção 1.

  5. Selecione o botão Gerir e selecioneConnections no menu. Criar esta ligação irá garantir que consegue executar análises de qualidade de dados na sua origem de dados nesse domínio de governação, impedindo que as equipas obtenham acesso ao conhecimento dos dados sem uma autorização adequada.

  6. Selecione Novo no ecrã de ligações para criar uma nova ligação:

    1. Indique o nome a apresentar "ADLSg2 DQ do Estado de Funcionamento Pessoal".
    2. Selecione o tipo de origem de Azure Data Lake Storage Gen2.
      1. Indique os detalhes da origem de dados criada na secção 2.

        Observação

        A credencial tem de ser o MICROSOFT Purview MSI (sistema) para uma ligação de qualidade de dados

      2. Selecione Testar ligação
      3. Assim que a ligação for testada, selecione Submeter

Assim que a ligação for estabelecida, estará pronto para executar perfis e começar a criar regras de qualidade de dados. Isto garante que os especialistas que conhecem as regras de negócio e as regras adequadas estão em execução nos produtos de dados mais importantes.

  1. Voltar à página Qualidade dos dados.
  2. Selecione o domínio de governação do Estado de Funcionamento Pessoal.
  3. Selecione o produto de dados Covid-19 Vacinação e Tendência de Casos por Idade incorporado na secção 3.
  4. Selecione o recurso que foi adicionado ao produto de dados. (Tem de estar no formato delta da secção 2 ou a qualidade dos dados não será executada).
  5. Aplique regras de qualidade de dados às colunas dos dados a medir se está a satisfazer as suas expectativas de qualidade:
    1. Selecione o separador Regras no recurso selecionado.
    2. Selecione Nova regra.
    3. Selecione Regra de campos vazios/em branco.
    4. Indique os detalhes:
      • Selecione a coluna AgeGroupVacc no menu pendente da coluna
      • Nome da Regra: Confirmar a Existência do Grupo Etário da Vacinação
    5. Selecione Criar.
    6. Selecione Nova regra.
    7. Selecione Correspondência de tipo de dados.
    8. Indique os detalhes.
    9. Selecione DataAdicionar coluna.
    10. Selecione Criar.
  6. Selecione Executar Análise de qualidade dos dados.

Dados de perfil

Crie um perfil para os seus dados verem as estáticas de alto nível de cada coluna e detetar anomalias que possam ter uma nova regra.

  1. Em Catálogo unificado, selecione Gestão de estado de funcionamento e, em seguida, selecione Qualidade dos dados.
  2. Selecionar Dados de perfil
  3. Selecione a caixa superior junto a Nome da coluna para criar perfis para todas as colunas. O Microsoft Purview recomendará as colunas a criar perfis e pode selecionar colunas que sabe que valem a pena criar perfis para ajudar a impedir perfis em dados altamente confidenciais ou dados que sabe que serão pouco preenchidos.
  4. Selecione Executar perfil

Quando a análise estiver concluída, poderá rever a classificação e o perfil da qualidade dos dados do seu novo produto de dados e a classificação de qualidade dos dados estará disponível para todos os utilizadores do catálogo, garantindo que todos conhecem a status dos dados.

Crie uma agenda para as análises de qualidade de dados para garantir que está continuamente a monitorizar problemas de qualidade dos dados. Defina alertas para se certificar de que está a resolver problemas de qualidade dos dados antes de os consumidores serem afetados.

  1. Em Gestão do estado de funcionamento, selecione Qualidade dos dados.
  2. Selecione o domínio Estado de Funcionamento Pessoal onde configurámos as regras de qualidade dos dados.
  3. Na lista pendente Gerir , selecione Análises agendadas.
  4. Na página Análises agendadas , selecione Novo.
  5. Adicionar detalhes da Descrição Geral
    1. Nome: Avaliação Mensal do DQ do Estado de Funcionamento Pessoal
    2. Descrição: análise mensal das regras de DQ para obter melhorias contínuas.
  6. Selecione Continuar
  7. Selecione o âmbito da análise
  8. Selecione a caixa junto ao produto de dados Vacinação Covid-19 e Tendência de Casos por Idade
  9. Selecione Continuar
  10. Agende a análise para garantir que é executada no último dia de cada mês
    1. Selecione Recorrente
    2. Periodicidade: a cada um mês
    3. Dias do mês: Último
    4. Hora de análise de agendamento (UTC): 12:00:00
    5. Iniciar periodicidade às (UTC): deixe como predefinição
  11. Selecione Continuar
  12. Reveja os detalhes da análise para ver se existem alterações que gostaria de fazer antes de guardar.
  13. Selecione Salvar. Uma vez que acionámos uma análise manual anteriormente, não precisamos de acionar outra análise agora, mas se for necessária uma nova análise, selecione Guardar e executar.

Configurar alertas

Assim que a qualidade dos dados tiver as análises agendadas, existem alertas que podem ser acionados para informar os responsáveis se existem problemas ou atenção necessários devido a problemas de qualidade dos dados ou falhas de análise. Configure um alerta de qualidade de dados para análises falhadas e quando a classificação diminui mais de 5%.

  1. Voltar ao domínio Estado de Funcionamento Pessoal na página Qualidade dos dados.
  2. Na lista pendente Gerir , selecione Alertas.
  3. Selecione Novo.
  4. Introduzir detalhes do alerta
    1. Nome a Apresentar: Análise Mensal do DQ do Estado de Funcionamento Pessoal
    2. Descrição: para garantir que os limiares mínimos de DQ estão a satisfazer as expectativas dos consumidores.
    3. Destino: a classificação diminui em mais do que
    4. Limiar: 5
    5. Desativar notificações: deixe desmarcado
    6. Ativar a notificação para análises de qualidade falhadas: deixar selecionada
    7. Destinatário: introduza o seu nome
  5. Selecione Continuar.

Dica

Ao implementar no seu Catálogo unificado irá querer enviar os alertas aos administradores que podem notificar os consumidores do problema e trabalhar com o proprietário técnico dos dados para fazer correções.

No final desta secção, terá agora um Catálogo unificado funcional com qualidade de dados operacionais para gerir os dados que está a oferecer aos consumidores de dados organizacionais. Tudo tem sido para obter os dados mais valiosos para o consumidor e criar confiança nos dados que eles estariam a utilizar. À medida que o valor dos dados aumenta e surgem novas estratégias de dados, a secção seguinte ajudará a mostrar como pode gerir todo o catálogo ou aprofundar a gestão de dados específica com Os Dados Principais.

Passo 5: Gestão de dados principal

A gestão de dados mestre é a prática de estar em conformidade com as entidades de dados mais importantes que têm de ser precisas, exclusivas e aplicadas de forma consistente em todas as áreas da empresa, porque os erros e problemas nestes dados podem afetar toda a empresa. Através de um dos nossos parceiros de MDM, poderá integrar a sua escolha de solução master Gerenciamento de Dados (MDM) com o Microsoft Purview para permitir a unificação, uniformização e limpeza de dados que permitirá a criação de registos dourados e a publicação de dados master como produtos de dados.

Siga os tutoriais aqui para obter a sua solução de eleição: Gestão de dados mestra no Microsoft Purview

Passo 6: Gerir o estado de funcionamento dos dados

No Microsoft Purview Data Estate Health, o Central Data Office e outros gestores de dados são capazes de avaliar a status dos dados em relação às normas da empresa e gerir eficazmente o progresso para a sua estratégia. Para garantir que todas as pessoas na empresa sabem o que pode ser feito para aumentar o valor dos seus dados, é essencial que as normas sejam compreendidas e dimensionáveis para toda a organização sem necessidade de tornar todos especialistas em governação de dados. A partir de um conjunto padrão de controlos da indústria que estão disponíveis no Microsoft Purview em cada escritório de dados e personalize os controlos para satisfazer as suas expetativas e garantir que estão alinhados com os seus objetivos de dados. Crítico para a eficácia destes controlos não é apenas a medição destas normas, mas também garantir que os responsáveis pelos dados são capazes de tomar medidas por si mesmos e ser responsabilizados por fazer as melhorias que afetam o valor dos dados. No Data Estate Health, pode definir e gerir todas estas capacidades críticas.

Pré-requisitos

Avaliar a governação de dados com o estado de funcionamento do património de dados

  1. Abra o portal do Microsoft Purview.

  2. Selecione Catálogo unificado.

  3. Em Estado de Funcionamento do Património de Dados no painel de navegação esquerdo, selecione Controlos de estado de funcionamento.

  4. Selecione a cenoura > junto ao grupo de controlo Criação de Valores .

  5. Ao pairar o cursor sobre um título de controlo, selecione o ícone de lápis para editar o controlo. Ao editar o controlo, altera o limiar do controlo para definir expectativas sobre qual deve ser a classificação e definir a classificação de cores para demonstrar as fases de progresso.

  6. Os detalhes permitem-lhe fornecer uma descrição do controlo e o que significa para a sua organização e definir um proprietário para um controlo específico.

  7. Selecione o separador Regras do controlo para alterar o limiar. Isto demonstra que tem um alvo elevado e, se não estiver em bom estado de funcionamento, é fundamental dar seguimento.

    1. Herdar do grupo: alterne para desativar (deve ficar cinzento).
    2. Pontuação de destino: 90
    3. Selecione Nova regra.
    4. Defina a caixa junto à classificação como GreaterThanOrEqual
    5. Definir a percentagem como 90
    6. Estado = Estado de funcionamento (verde)
    7. Estado da Caixa else = Crítico (Roxo)
    8. Selecione Salvar.
  8. Em Estado de funcionamento do património de dados, selecione Qualidade dos metadados.

Aqui, pode alterar ou adicionar regras que criam as classificações do controlo. Aqui, queremos alterar a gravidade das ações de Criação de Valor para garantir que todos os utilizadores sabem a importância desta ação.

  1. Selecione Configurar gravidade
  2. Selecione o grupo de controlo Criação de Valores
  3. Selecione o título do controlo de alinhamento DE OKRs de Negócio
  4. Altere a Gravidade de Média para Alta e selecione Guardar
  5. Selecione o separador Ações de estado de funcionamento
  6. Filtro Atribuído a: para o seu nome
  7. Selecione uma ação onde possa ver o que o proprietário da ação precisa de fazer para garantir que as expectativas de governação são satisfeitas ou que pode atribuir um novo proprietário para obter o melhor especialista para fornecer os seus contributos. Há também uma status que permite que outras pessoas saibam o que está em curso e onde outras ações podem precisar de atribuição de prioridades.

Passo 7: democratização dos dados

Permitir que os utilizadores localizem e acedam aos dados de que precisam de uma forma de reclamação é a essência da democratização dos dados e garante que as pessoas conseguem encontrar os dados de que precisam para criar valor comercial. Proporcionar uma experiência limpo e fácil de detetar dados é o objetivo de Catálogo unificado do Microsoft Purview, ao mesmo tempo que permite que os administradores atualizem e giram os dados disponibilizados no catálogo em escala. Nesta secção, explicamos como os utilizadores podem encontrar e pedir acesso aos dados e garantir que os aprovadores adequados conseguem controlar e fornecer entradas nesses pedidos de acesso.

Pré-requisitos

Descobrir produtos de dados

  1. Em Catálogo unificado, selecione Deteção e, em seguida, selecione Produtos de dados.
  2. Na página Produtos de dados , utilize a barra de pesquisa para procurar taxas de vacinação por idade.
  3. Aqui, verá os produtos de dados que publicou na secção 2. Isto mostra como os utilizadores só serão expostos aos dados destinados a detetar e impede que os utilizadores tenham de navegar num património de dados altamente técnicos.
  4. Selecione o produto de dados Vacinação Covid-19 e Tendência de Casos por Idade
    1. Aqui, os consumidores podem ver os metadados que forneceu e qualquer uma das outras propriedades que foram configuradas durante a configuração. A classificação de qualidade dos dados também está aqui para que os consumidores saibam a qualidade antes mesmo de terem acesso aos dados.
    2. Selecione o recurso e o consumidor pode ver que todas as colunas em estão disponíveis no recurso de dados.
    3. Selecione o termo Glossário do surto e o consumidor pode ver a descrição e outras informações sobre o termo para obter uma compreensão mais profunda dos dados.
  5. Assim que o consumidor estiver confiante de que pretende utilizar esses dados, tem de obter acesso aprovado aos dados.
    1. Selecione Pedir acesso
    2. Preencha os detalhes do formulário para submeter um pedido.
    3. Utilizador: deixe o seu nome
    4. Aprovação do Gestor: automaticamente necessária e direcionada para o gestor de Microsoft Entra ID.
    5. Objetivo: selecione uma finalidade
    6. Justificação comercial: monitorização OKR
    7. Selecione a caixa junto ao atestado para dizer que compreende as expetativas de utilização destes dados.
    8. Selecione Enviar.

O pedido de acesso será agora enviado para a lista gerida no Microsoft Entra ID. A partir daqui, o gestor pode aceder aos pedidos ao abrir o e-mail e selecionar uma ligação ou ao aceder ao Microsoft Purview. A aprovação e a gestão do acesso podem ser feitas diretamente no Microsoft Purview.

  1. Em Catálogo unificado, selecione Gestão do catálogo e, em seguida, selecione Pedidos.
  2. Selecione o domínio Estado de Funcionamento Pessoal .
  3. Selecione o pedido que submeteu.
  4. Agora, os aprovadores podem aprovar ou recusar ao selecionar Responder no pedido.