Происхождение данных
Происхождение данных играет важную роль в облачной аналитике. Lineage показывает зависимости между необработанными данными и готовыми продуктами, описывая преобразования и манипуляции, которые преобразуют необработанные данные в конечные продукты данных. Происхождение данных охватывает жизненный цикл данных от источника до перемещения по свойству данных. Он используется для устранения неполадок, анализа первопричин, анализа качества данных, соответствия и анализа влияния. Он также добавляет контекст к наборам данных и продуктам, которые позволяют обнаруживать и самостоятельно обслуживать продукты данных.
Основная функция любого каталога данных — это возможность отображения происхождения между продуктами данных.
Каталог данных Microsoft Purview подключается к различным системам обработки данных, хранения и аналитики для извлечения сведений о происхождении. Цель заключается в представлении перемещения, преобразования и операционных метаданных из каждой системы данных.
Для решений по интеграции данных рекомендуется использовать Azure Data Factory и конвейеры Azure Synapse, так как они обеспечивают отслеживание происхождения данных в Microsoft Purview. Альтернативные шаблоны загрузки данных должны использовать API Apache Atlas для обновления линейки данных в рамках обработки данных.
Microsoft Fabric поддерживает происхождение, не требуя Microsoft Purview. Если вам нужно одно место для просмотра родословной, рекомендуется настроить Microsoft Purview для сканирования тенанта Microsoft Fabric, так как этот параметр автоматически переносит метаданные и родословную из элементов Fabric, включая Power BI, в каталог данных Microsoft Purview. Дополнительные сведения см. в Lineage in Fabric и Как получить происхождение из элементов Microsoft Fabric в Microsoft Purview.
Совет
Дополнительные сведения о поддерживаемых системах и рекомендациях см. в статье Data Lineage в Microsoft Purview.
Следующие шаги
Узнайте, как управлять главными данными в Azure.