Catálogo de dados
O catálogo de dados registra e mantém as informações de dados em um local centralizado e as disponibiliza para a organização. Ele garante que as empresas evitem produtos de dados duplicados causados pela ingestão de dados redundantes por diferentes equipes de projeto. Recomendamos que você crie um serviço de catálogo de dados para definir os metadados dos produtos de dados armazenados nas zonas de aterrissagem de dados.
A análise em escala de nuvem depende do Microsoft Purview para registrar fontes de dados corporativas, classificá-las, garantir a qualidade dos dados e oferecer acesso seguro e de autoatendimento.
O Microsoft Purview é um serviço baseado em locatário e pode se comunicar com cada zona de aterrissagem de dados criando uma Rede Virtual Gerenciada implantada na região de suas zonas de aterrissagem de dados. Você pode implantar o Azure Managed Virtual Network Integration Runtimes (IR) dentro das Redes Virtuais Gerenciadas do Microsoft Purview em qualquer região disponível do Microsoft Purview. A partir daí, o IR da rede virtual gerenciada pode usar pontos de extremidade privados para se conectar e verificar com segurança as fontes de dados suportadas. Para obter mais informações, consulte Usar rede virtual gerenciada com sua conta do Microsoft Purview. A criação de um RI de rede virtual gerenciado dentro da Rede Virtual Gerenciada garante que o processo de integração de dados seja isolado e seguro.
Ao usar o Azure Databricks, recomendamos usar do Azure Databricks Unity Catalog além do Microsoft Purview. O Azure Databricks Unity Catalog fornece recursos centralizados de controle de acesso, auditoria, linhagem e descoberta de dados nos espaços de trabalho do Databricks. Para obter as práticas recomendadas para configurar o Catálogo Unity, consulte Práticas recomendadas do Catálogo Unity.
Nota
Embora esta documentação se concentre principalmente no uso do Microsoft Purview para governança, as empresas podem ter investido em outros produtos, como Alation, Okera ou Collibra. Essas soluções são baseadas em assinatura e recomendamos implantá-las na zona de aterrissagem de gerenciamento de dados. Esteja ciente de que alguma integração personalizada pode ser necessária.
Deteção de dados
A descoberta de dados reflete o estado de todos os dados que a empresa possui. Esses dados são conhecidos como propriedade de dados. Durante a descoberta de dados, a propriedade de dados é verificada e classificada. O processo de digitalização de dados se conecta diretamente à fonte de dados de acordo com um cronograma definido.
À medida que você adiciona uma nova zona de aterrissagem de dados ao ambiente, os data lakes associados e as fontes de persistência poliglota devem ser registrados como fontes para os rastreadores de catálogo de dados examinarem.
Com a descoberta automatizada de seu conjunto de dados para preencher o catálogo, você pode:
- Rastrear metadados do Azure e de fontes de dados locais
- Analise seus data lakes, blobs e outros destinos suportados
- Extraia o esquema de seus destinos de dados para os tipos de arquivo XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro e ORC
- Permitir atualizações automatizadas de catálogo por meio do agendamento configurável de verificações e conjuntos de regras de verificação
Importante
Ao adicionar uma nova zona de aterrissagem de dados ao ambiente, registre os data lakes associados e o armazenamento poliglota por meio do Azure DevOps como uma fonte para os rastreadores de catálogo de dados verificarem, governarem e gerenciarem a integridade dos dados.
Classificação de dados
O Microsoft Purview permite que você aplique classificações de dados personalizadas ou do sistema em ativos de arquivo, tabela ou coluna.
As classificações de dados são como tags de assunto. O Microsoft Purview marca e identifica o conteúdo de tipos de dados específicos encontrados em seu conjunto de dados durante a verificação. Você usa rótulos de confidencialidade para identificar as categorias de tipos de classificação em seus dados organizacionais. Você também pode usar rótulos de sensibilidade para agrupar as políticas que deseja aplicar a cada categoria. O Microsoft Purview usa os mesmos tipos de informações confidenciais do Microsoft 365, permitindo que você estenda suas políticas e proteções de segurança existentes em todo o seu conteúdo e patrimônio de dados.
O Microsoft Purview pode digitalizar e classificar documentos automaticamente. Por exemplo, se você tiver um arquivo nomeado multiple.docx
e ele tiver um número de ID nacional em seu conteúdo, o Microsoft Purview adicionará uma classificação, como EU National Identification Number
na página de detalhes do ativo.
O Microsoft Defender for SQL é um recurso disponível para o Banco de Dados SQL do Azure, a Instância Gerenciada SQL do Azure e o Azure Synapse Analytics. Inclui a funcionalidade para detetar e classificar dados confidenciais, analisar e mitigar potenciais vulnerabilidades da sua base de dados e detetar atividades anómalas que podem indicar uma ameaça à sua base de dados. O Microsoft Defender para SQL fornece um único local de acesso para habilitar e gerenciar esses recursos.