Compartilhar via


Catálogo de dados

O catálogo de dados registra e mantém as informações dos dados em um local centralizado e as disponibiliza para a organização. Ele garante que as empresas evitem produtos de dados duplicados causados ​​pela ingestão de dados redundantes por diferentes equipes de projeto.

Recomendamos que você crie um serviço de catálogo de dados para definir os metadados dos produtos de dados armazenados nas zonas de destino de dados.

A análise em escala de nuvem depende do Microsoft Purview para registrar fontes de dados corporativas, classificá-las, garantir a qualidade dos dados e oferecer acesso seguro e de autoatendimento.

O Microsoft Purview é um serviço baseado em locatário e pode se comunicar com cada zona de destino de dados criando uma Rede Virtual Gerenciada implantada na região de suas zonas de destino de dados. Você pode implantar o Rede Virtual gerenciada do Microsoft Azure Integration Runtimes (IR) nas Redes Virtuais Gerenciadas do Microsoft Purview em qualquer região disponível do Microsoft Purview. A partir daí, o IR da rede virtual gerenciada pode usar pontos de extremidade privados para se conectar com segurança e verificar as fontes de dados com suporte. Para obter mais informações, consulte Usar a rede virtual gerenciada com sua conta do Microsoft Purview. A criação de uma IR de rede virtual gerenciada na rede virtual gerenciada garante que o processo de integração de dados seja isolado e seguro.

Observação

Embora esta documentação se concentre principalmente no uso do Microsoft Purview para governança, as empresas podem ter investido em outros produtos, como Alation, Okera ou Collibra. Essas soluções são baseadas em assinatura e recomendamos implantá-las na zona de destino de gerenciamento de dados. Esteja ciente de que isso poderá exigir algumas integrações personalizadas.

Descoberta de dados

A descoberta de dados reflete o estado de todos os dados da empresa. Eles compõem a propriedade de dados. Durante a descoberta, a propriedade de dados é verificada e classificada. O processo de exame conecta-se diretamente à fonte de dados de acordo com um agendamento definido.

À medida que você adiciona uma nova zona de destino de dados ao ambiente, os data lakes e as fontes de persistência poliglota associados devem ser registrados como fontes para os rastreadores do catálogo de dados examinarem.

Com a descoberta automatizada da propriedade de dados para preencher o catálogo, é possível:

  • Rastrear metadados de fontes de dados locais e do Azure
  • Examinar seus data lakes, blobs e outros destinos compatíveis
  • Extrair o esquema dos destinos de dados para tipos de arquivo XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro e ORC
  • Permitir atualizações automatizadas do catálogo por meio do agendamento configurável de exames e conjuntos de regras de exame

Importante

Ao adicionar uma nova zona de destino de dados ao ambiente, registre os data lakes associados e o armazenamento poliglota por meio do Azure DevOps como uma fonte para que os rastreadores do catálogo de dados examinem, governem e gerenciem a integridade dos dados.

Classificação de dados

O Microsoft Purview permite que você aplique classificações de dados do sistema ou personalizadas em ativos de arquivo, tabela ou coluna.

As classificações de dados são como marcas de assunto. O Microsoft Purview marca e identifica o conteúdo de tipos de dados específicos encontrados em seu patrimônio de dados durante a verificação. Você usa rótulos de confidencialidade para identificar as categorias de tipos de classificação em seus dados organizacionais. Também é possível usar rótulos de confidencialidade para agrupar as políticas que serão aplicadas a cada categoria. O Microsoft Purview faz uso dos mesmos tipos de informações confidenciais que o Microsoft 365, permitindo que você alongue suas políticas de segurança e proteções existentes em todo o seu conteúdo e patrimônio de dados.

O Microsoft Purview pode examinar e classificar documentos automaticamente. Por exemplo, se você tiver um arquivo chamado multiple.docx e ele tiver um número de ID nacional em seu conteúdo, o Microsoft Purview adiciona uma classificação, por exemplo, EU National Identification Number à página de detalhes do ativo.

O Microsoft Defender para SQL está disponível para Banco de Dados SQL do Azure, Instância Gerenciada de SQL do Azure e Azure Synapse Analytics. Ele inclui a funcionalidade para descobrir e classificar dados confidenciais, identificando e atenuante banco de dados vulnerabilidades potenciais e detectar atividades anormais que podem indicar uma ameaça para seu banco de dados. O Microsoft Defender para SQL fornece um local centralizado para habilitar e gerenciar esses recursos.

Próximas etapas