Partilhar via


Linhagem de dados

A linhagem de dados desempenha um papel importante na análise em escala de nuvem. Linhagem mostra dependências entre dados brutos e produtos acabados, descrevendo as transformações e manipulações que transformam dados brutos em produtos de dados finais. A linhagem de dados abrange o ciclo de vida dos dados, desde a sua origem até ao seu movimento através do património de dados. Ele é usado para solução de problemas, análise de causa raiz, análise de qualidade de dados, conformidade e análise de impacto. Ele também adiciona contexto a conjuntos de dados e produtos que permitem que os produtos de dados sejam detetáveis e autossuficientes.

Uma característica principal de qualquer catálogo de dados é sua capacidade de mostrar a linhagem entre produtos de dados.

O Microsoft Purview Data Catalog se conecta a vários sistemas de processamento, armazenamento e análise de dados para extrair informações de linhagem. O objetivo é representar o movimento, a transformação e os metadados operacionais de cada sistema de dados.

Os pipelines do Azure Data Factory e do Azure Synapse são recomendados para soluções de ingestão porque habilitam a linhagem de dados no Microsoft Purview. Padrões de ingestão alternativos devem usar a API do Apache Atlas para atualizar a linhagem de dados como parte de seu processamento de dados.

O Microsoft Fabric suporta linhagem sem exigir o Microsoft Purview. Se precisar de um único local para exibir a linhagem, recomendamos definir o Microsoft Purview para fazer uma varredura em um locatário do Microsoft Fabric, pois essa configuração traz automaticamente metadados e linhagem de itens do Fabric, incluindo o Power BI, para o Catálogo de Dados do Microsoft Purview. Para obter mais informações, consulte Linhas no Fabric e Como obter a linhagem de itens do Microsoft Fabric para o Microsoft Purview.

Gorjeta

Para obter mais informações sobre sistemas suportados e práticas recomendadas, consulte Linhagem de dados no Microsoft Purview.

Próximos passos

Saiba como gerenciar dados mestre no Azure.