Nadzór nad danymi przy użyciu wykazu aparatu Unity i usługi Microsoft Purview

Ukończone

Nadzór nad danymi ma kluczowe znaczenie dla zapewnienia, że dane w organizacji są zarządzane bezpiecznie, wydajnie i zgodnie z przepisami. Usługa Azure Databricks w połączeniu z katalogiem aparatu Unity i usługą Microsoft Purview zapewnia niezawodne rozwiązanie do efektywnego zarządzania danymi i zarządzania nimi.

Narzędzia do zapewniania ładu danych

Omówienie sposobu implementacji ładu danych przy użyciu wykazu aparatu Unity i usługi Microsoft Purview jest następujące.

Unity Catalog

Wykaz aparatu Unity to funkcja w usłudze Azure Databricks, która oferuje ujednolicone rozwiązanie do zapewniania ładu dla wszystkich danych i zasobów sztucznej inteligencji. Zapewnia scentralizowany magazyn metadanych, który zarządza obiektami danych we wszystkich obszarach roboczych w organizacji.

Unity Catalog

Microsoft Purview

Microsoft Purview to ujednolicona usługa zapewniania ładu danych, która ułatwia zarządzanie danymi lokalnymi, wielochmurowymi i danymi SaaS (software-as-a-service). Zapewnia ona możliwości, takie jak odnajdywanie danych, klasyfikacja danych, pochodzenie danych i nadzór nad dostępem do danych.

Microsoft Purview

Omówienie wykazu aparatu Unity

Wykaz aparatu Unity w usłudze Azure Databricks to scentralizowany magazyn metadanych, który zarządza metadanymi dla wszystkich zasobów danych i zasobów sztucznej inteligencji w obszarach roboczych usługi Databricks. Umożliwia precyzyjne mechanizmy kontroli zabezpieczeń i zasady ładu na dużą skalę, co ułatwia bezpieczne zarządzanie danymi w wielu zespołach i projektach.

Najważniejsze funkcje wykazu aparatu Unity

  • Ujednolicona przestrzeń nazw: Katalog aparatu Unity oferuje jedną przestrzeń nazw dla zestawów danych, plików i modeli uczenia maszynowego we wszystkich obszarach roboczych, co ułatwia zarządzanie zasobami i odnajdywanie ich.

  • Szczegółowa kontrola dostępu: umożliwia administratorom ustawianie precyzyjnych kontroli dostępu do danych przy użyciu standardowych instrukcji PROGRAMU SQL GRANT i REVOKE, zgodnie z zasadą najniższych uprawnień.

  • Pochodzenie danych: wykaz aparatu Unity przechwytuje i wyświetla pochodzenie danych, co ma kluczowe znaczenie dla śledzenia przepływu danych i zrozumienia ich przekształceń w czasie.

  • Scentralizowane zarządzanie metadanymi: centralnie zarządza wszystkimi metadanymi, zapewniając, że definicje, opisy i inne metadane są spójne w projektach i obszarach roboczych.

  • Integracja z usługą Databricks SQL: usługa Unity Catalog jest w pełni zintegrowana z usługą Databricks SQL, umożliwiając bezproblemowe wykonywanie zapytań i zarządzanie zasobami danych bez przenoszenia danych z platformy.

Omówienie usługi Microsoft Purview

Usługa Microsoft Purview oferuje zestaw narzędzi do zapewniania ładu danych zaprojektowanych w celu zapewnienia widoczności, kontroli i wglądu w użycie danych w całej organizacji. Ułatwia odnajdywanie, klasyfikowanie, ochronę i monitorowanie danych niezależnie od tego, gdzie się znajdują.

Najważniejsze funkcje usługi Microsoft Purview dla usługi Azure Databricks

  • Odnajdywanie i klasyfikacja danych: automatyczne skanowanie i klasyfikowanie danych w środowisku usługi Azure Databricks przy użyciu wbudowanych klasyfikatorów, a także tworzenie niestandardowych klasyfikatorów.

  • Pochodzenie danych: zapewnia szczegółowy wgląd w pochodzenie danych, pokazując sposób przekształcania i przenoszenia danych w różnych systemach i procesach, w tym w usłudze Azure Databricks.

  • Mapa danych: agreguje metadane z różnych źródeł danych do katalogu z możliwością wyszukiwania, co pozwala użytkownikom zrozumieć krajobraz danych i jego relacje.

  • Zarządzanie dostępem i zasadami: umożliwia tworzenie zasad ładu, które wymuszają uzyskiwanie dostępu do danych i ich używanie w usłudze Azure Databricks i innych zintegrowanych systemach.

  • Szczegółowe informacje i raportowanie: oferuje szczegółowe raporty dotyczące odnajdywania danych, klasyfikacji poufności i analizy dostępu, pomagając zapewnić zgodność i optymalizowanie strategii zapewniania ładu danych.