Katalog danych
Wykaz danych rejestruje i utrzymuje informacje o danych w scentralizowanym miejscu i udostępnia je organizacji. Gwarantuje to, że przedsiębiorstwa unikają zduplikowanych produktów danych spowodowanych nadmiarowym pozyskiwaniem danych przez różne zespoły projektów. Zalecamy utworzenie usługi wykazu danych w celu zdefiniowania metadanych produktów danych przechowywanych w strefach docelowych danych.
Analiza w skali chmury zależy od usługi Microsoft Purview do rejestrowania źródeł danych przedsiębiorstwa, klasyfikowania ich, zapewniania jakości danych i oferowania bezpiecznego, samoobsługowego dostępu.
Microsoft Purview to usługa oparta na dzierżawie i może komunikować się z każdą strefą lądowania danych przez utworzenie zarządzanej sieci wirtualnej wdrożonej w regionie stref lądowania danych. Środowiska Azure Managed Virtual Network Integration Runtime (IR) można wdrożyć w zarządzanych sieciach wirtualnych firmy Microsoft Purview w dowolnym dostępnym regionie usługi Microsoft Purview. Stamtąd środowisko IR zarządzanej sieci wirtualnej może używać prywatnych punktów końcowych do bezpiecznego nawiązywania połączenia z obsługiwanymi źródłami danych i skanowania ich. Aby uzyskać więcej informacji, zobacz Use Managed virtual network with your Microsoft Purview account (Używanie zarządzanej sieci wirtualnej przy użyciu konta usługi Microsoft Purview). Utworzenie zarządzanego środowiska IR sieci wirtualnej w ramach zarządzanej sieci wirtualnej gwarantuje, że proces integracji danych jest odizolowany i bezpieczny.
W przypadku korzystania z usługi Azure Databricks zalecamy używanie Unity Catalog usługi Azure Databricks w połączeniu z usługą Microsoft Purview. Usługa Azure Databricks Unity Catalog zapewnia scentralizowaną kontrolę dostępu, audytowanie, liniowość danych i funkcje odnajdywania danych w obszarach roboczych Databricks. Aby uzyskać najlepsze praktyki dotyczące konfigurowania Unity Catalog, zobacz Unity Catalog best practices.
Uwaga
Mimo że ta dokumentacja koncentruje się głównie na korzystaniu z usługi Microsoft Purview w celu zapewnienia ładu, przedsiębiorstwa mogły zainwestować w inne produkty, takie jak Alation, Okera lub Collibra. Te rozwiązania są oparte na subskrypcji i zalecamy ich wdrożenie w strefie docelowej zarządzania danymi. Należy pamiętać, że może być wymagana integracja niestandardowa.
Odnajdywanie danych
Odnajdywanie danych odzwierciedla stan wszystkich danych, które jest właścicielem przedsiębiorstwa. Te dane są nazywane infrastrukturą danych. Podczas odnajdywania danych majątek danych jest skanowany i klasyfikowany. Proces skanowania danych łączy się bezpośrednio ze źródłem danych zgodnie z ustawionym harmonogramem.
W miarę dodawania nowej strefy docelowej danych do środowiska skojarzone magazyny danych i źródła trwałości wielolotowej muszą być zarejestrowane jako źródła przeszukiwarki wykazu danych do skanowania.
Za pomocą zautomatyzowanego odnajdywania twoich zasobów danych w celu wypełnienia wykazu można wykonywać następujące czynności:
- Przeszukiwanie metadanych z platformy Azure i lokalnych źródeł danych
- Skanowanie magazynów danych, obiektów blob i innych obsługiwanych obiektów docelowych
- Wyodrębnianie schematu z obiektów docelowych danych dla typów plików XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro i ORC
- Zezwalaj na automatyczne aktualizacje wykazu za pomocą konfigurowalnego planowania skanowania i zestawów reguł skanowania
Ważne
Po dodaniu nowej strefy lądowania danych do środowiska zarejestruj skojarzone jeziora danych i magazyny poliglotyczne za pośrednictwem usługi Azure DevOps jako źródło dla przeszukiwarki wykazu danych, aby skanować, nadzorować i zarządzać integralnością danych.
Klasyfikacja danych
Usługa Microsoft Purview umożliwia stosowanie systemowych lub niestandardowych klasyfikacji danych w zasobach plików, tabel lub kolumn.
Klasyfikacje danych są podobne do tagów podmiotów. Usługa Microsoft Purview oznacza i identyfikuje zawartość określonych typów danych znalezionych w obrębie majątku danych podczas skanowania. Etykiety poufności służą do identyfikowania kategorii typów klasyfikacji w danych organizacji. Możesz również użyć etykiet poufności do grupowania zasad, które chcesz zastosować do każdej kategorii. Usługa Microsoft Purview korzysta z tych samych typów informacji poufnych co platforma Microsoft 365, umożliwiając rozszerzenie istniejących zasad zabezpieczeń i ochrony w całej zawartości i majątku danych.
Usługa Microsoft Purview może skanować i automatycznie klasyfikować dokumenty. Jeśli na przykład masz plik o nazwie multiple.docx
i ma numer identyfikatora narodowego w jego zawartości, usługa Microsoft Purview dodaje klasyfikację, taką jak EU National Identification Number
na stronie szczegółów zasobu.
Usługa Microsoft Defender for SQL to funkcja dostępna dla usług Azure SQL Database, Azure SQL Managed Instance i Azure Synapse Analytics. Obejmuje to funkcję wykrywania i klasyfikowania danych poufnych, uwidacznianie i korygowanie potencjalnych luk w zabezpieczeniach bazy danych oraz wykrywanie nietypowych działań, które mogą wskazywać, że baza danych jest zagrożona. Usługa Microsoft Defender for SQL udostępnia pojedynczą lokalizację goto umożliwiającą włączanie tych funkcji i zarządzanie nimi.