Управление данными с помощью каталога Unity и Microsoft Purview
Управление данными крайне важно для обеспечения безопасного и эффективного управления данными в организации и соответствия нормативным требованиям. Azure Databricks в сочетании с каталогом Unity и Microsoft Purview предоставляет надежное решение для эффективного управления данными и управления ими.
Средства управления данными
Обзор реализации управления данными с помощью каталога Unity и Microsoft Purview следует.
Каталог Unity
Каталог Unity — это функция в Azure Databricks, которая предлагает единое решение для управления всеми данными и ресурсами ИИ. Она предоставляет централизованное хранилище метаданных, которое управляет объектами данных во всех рабочих областях организации.
Microsoft Purview
Microsoft Purview — это единая служба управления данными, которая помогает управлять локальными, многооблачными и программными данными как услуга (SaaS). Он предоставляет такие возможности, как обнаружение данных, классификация данных, происхождение данных и управление доступом к данным.
Обзор Unity Catalog
Каталог Unity в Azure Databricks — это централизованное хранилище метаданных, которое управляет метаданными для всех ресурсов данных и ресурсов ИИ в рабочих областях Databricks. Она обеспечивает более детальное управление безопасностью и политики управления в масштабе, что упрощает управление данными в нескольких командах и проектах.
Ключевые функции каталога Unity
Единое пространство имен: каталог Unity предлагает единое пространство имен для наборов данных, файлов и моделей машинного обучения во всех рабочих областях, что упрощает управление ресурсами и их обнаружение.
Точное контроль доступа: позволяет администраторам задавать точные элементы управления доступом для данных с помощью стандартных инструкций SQL GRANT и REVOKE, которые соответствуют принципу наименьших привилегий.
Data Lineage: каталог Unity фиксирует и отображает происхождение данных, что крайне важно для отслеживания потока данных и понимания его преобразований с течением времени.
Централизованное управление метаданными: централизованно управляет всеми метаданными, обеспечивая согласованность определений, описаний и других метаданных в проектах и рабочих областях.
Интеграция с Databricks SQL: каталог Unity полностью интегрирован с Databricks SQL, что позволяет легко запрашивать и управлять ресурсами данных без перемещения данных из платформы.
Обзор Microsoft Purview
Microsoft Purview предлагает набор средств управления данными, предназначенных для обеспечения видимости, контроля и аналитических сведений об использовании данных в организации. Он помогает обнаруживать, классифицировать, защищать и отслеживать данные независимо от того, где он находится.
Ключевые функции Microsoft Purview для Azure Databricks
Обнаружение и классификация данных. Автоматическое сканирование и классификация данных в среде Azure Databricks с помощью встроенных классификаторов, а также создание пользовательских классификаторов.
Происхождение данных: обеспечивает подробную видимость происхождения данных, показывающую, как данные преобразуются и перемещаются между различными системами и процессами, в том числе в Azure Databricks.
Карта данных: объединяет метаданные из различных источников данных в каталог, доступный для поиска, что позволяет пользователям понять ландшафт данных и его связи.
Управление доступом и политиками. Позволяет создавать политики управления, которые применяют доступ к данным и используются в Azure Databricks и других интегрированных системах.
Аналитические сведения и отчеты. Предоставляет подробные отчеты об обнаружении данных, классификации конфиденциальности и аналитике доступа, помогая обеспечить соответствие и оптимизировать стратегии управления данными.