Standardy metadat
Správa metadat hraje zásadní roli v architektuře dat. Metadata jsou data o jiných datech. Popisuje data a poskytuje odkaz, který vám pomůže najít, zabezpečit a řídit data. Metadata také spojují data. Dá se použít k ověření integrity a kvality dat, směrování nebo replikaci dat do nového umístění, transformace dat a pochopení významů dat. Metadata jsou také nezbytná pro demokratizaci dat prostřednictvím samoobslužných portálů.
V oboru je stále rostoucí trend, který přibližuje datové přehledy datovým analytikům a vědcům pomocí portálů, které používají více metadat. Tento trend se označuje jako pozorovatelnost dat. Pozorovatelnost dat používá koncepty, jako jsou metadata lake, grafy znalostí nebo grafy metadat, k popisu platforem, kde jsou metadata centralizovaná. Je to dobrý způsob, jak vytvořit jednotný přehled o tom, jak se data používají a zdrojují v celé organizaci při použití distribuované datové sítě.
Dobrá strategie správy metadat roste ekologicky. Začíná jednoduchým a malým tím, že nejprve identifikuje nejdůležitější oblasti. Služba a jasné procesy podporují také dobrou strategii správy metadat. Abyste mohli začít, je dobré vědět o různých kategoriích metadat:
- Obchodní metadata popisují všechny aspekty používané pro zásady správného řízení, hledání a pochopení dat. Mezi známé příklady patří obchodní termíny a definice a informace o vlastnictví, využití a původu dat.
- Technická metadata popisují strukturální aspekty dat v době návrhu. Mezi známé příklady patří informace o schématu, formát dat a informace o protokolu a šifrovací a dešifrovací klíče.
- Provozní metadata popisují aspekty zpracování dat za běhu. Mezi známé příklady patří informace o procesu, doba provádění, informace o selhání procesu a ID úloh.
- Sociální metadata popisují perspektivu uživatele dat od jejich příjemců. Mezi známé příklady patří použití a informace o sledování uživatelů, data výsledků hledání, filtry a kliknutí, zobrazení času, přístupy k profilu a komentáře.
V decentralizované architektuře dat je správa metadat organizační výzvou, která vyžaduje nalezení rovnováhy mezi centrálně spravovanými metadaty a federovanými spravovanými metadaty. Při plánování správy metadat je důležité porozumět týmům a funkcím pro analýzy na úrovni cloudu v Azure. Použití praxe správy dat pro spolupráci může zlepšit automatizaci komunikace, integrace a toku dat mezi vašimi týmy. Některé složitosti správy metadat můžete vyřešit tím, že dosáhnete správné rovnováhy mezi centrálními zásadami správného řízení a vlastnictvím domény.
Při rozhodování, která metadata chcete spravovat centrálně nebo sdílet do vašich datových domén, a při zahájení implementace si položte následující otázky:
- Jaká obchodní metadata jsou důležitá?
- Jaká technická metadata se vyžadují pro interoperabilitu?
- Jaké procesy a streamy data zachycují?
- Kde jsou modely nebo schémata vytvořená a udržovaná?
- Jaké informace musí týmy poskytovat centrálně, aby oddělení zásad správného řízení dat fungovalo správně?
Pomocí odpovědí na tyto otázky namapujte životní cyklus obsahu pro každý datový proud metadat a určete všechny závislosti. Pak máte model metadat, který může propojit obchodní domény, procesy, technologie a data.
Jakmile víte, která metadata potřebujete, musíte zvolit místo, kam ho chcete uložit a zpracovat. K tomu můžete použít Microsoft Purview.
Použití Microsoft Purview ke správě datových aktiv ve velkém
Microsoft Purview je jednotné řešení zásad správného řízení dat, které vám pomůže spravovat a řídit místní data, multicloudová data a data saaS (software jako služba). Spravuje metadata ve velkém měřítku, protože je to plně automatizovaná služba, která inteligentně provádí zjišťování dat, prohledávání dat, kvalitu dat a správu přístupu. Poskytuje také holistickou mapu s mnoha přehledy o architektuře datových sítí.
Microsoft Purview je komplexní sada řešení, která můžou vaší organizaci pomoct řídit, chránit a spravovat data bez ohledu na to, kde se nacházejí. Řešení Microsoft Purview poskytují integrované pokrytí a pomáhají řešit fragmentaci dat napříč organizacemi, nedostatek viditelnosti, která brání ochraně a zásadám správného řízení dat a rozmazaní tradičních rolí správy IT.
Microsoft Purview kombinuje řešení a služby zásad správného řízení dat a služeb do sjednocené platformy, která vaší organizaci pomůže:
- Získání přehledu o datech v celé organizaci
- Chraňte a spravujte citlivá data v celém jejich životním cyklu, ať už se nacházejí kdekoli.
- Bezproblémové řízení dat novými a komplexními způsoby
- Správa kritických rizik dat a zákonných požadavků
Při implementaci Microsoft Purview nepoužívejte příliš mnoho změn a složitosti rychle. Technická metadata tvoří základ Microsoft Purview. Před pochopením musíte shromáždit a uspořádat metadata.
Jakmile budete mít metadata, začněte základy:
- Obchodní podmínky
- Seznamy autoritativních zdrojů dat
- Seznamy databází
- Domény zásad správného řízení
- Informace o schématu
- Vlastnictví dat
- Správa dat
- Zabezpečení
- Kvalita dat
Pak můžete škálovat pomalým zapojením dalších vlastníků domén a správy dat a přidáním dalších klasifikací a popisků citlivosti. Tyto doplňky zlepšují vyhledávání a umožňují lepší správu přístupu k datům.
Microsoft Purview nabízí funkci označovanou jako domény zásad správného řízení, která stanovuje hranice pro jednotné zásady správného řízení, vlastnictví a zjišťování datových produktů a obchodních konceptů v rámci architektury orientované na doménu. Další informace naleznete v tématu domény zásad správného řízení v Microsoft Purview.
Vytvoření znalostního grafu pomocí služby Azure Cosmos DB
Řešení přehledu dat musí popsat způsob použití dat a vztahy mezi entitami, jako jsou zdrojová data a datové produkty, a mezi datovými produkty z jedné domény a závislými produkty z jiné domény. K modelování těchto vztahů můžete použít grafovou databázi nebo vlastní uživatelské rozhraní.
Pokud chcete vytvořit jednotné zobrazení dat vaší organizace s vlastním uživatelským prostředím, zvažte použití služby Azure Cosmos DB. Azure Cosmos DB je globálně distribuovaná databázová služba s více modely s koncovými body NoSQL. Poskytuje službu grafové databáze prostřednictvím služby Azure Cosmos DB pro Apache Gremlin, která dokáže ukládat masivní grafy s miliardami vrcholů a hran.
Konečným výsledkem architektury Azure Cosmos DB je celoorganizovaný graf, který poskytuje jednotné zobrazení všech dat ve vaší organizaci s kompletním kontextem. Jezero metadat není jen o ukládání informací. Také aktivně organizuje metadata jako graf tím, že je připojí k dalším službám a nástrojům. Tento uspořádaný graf umožňuje křížově korelovat mnoho oblastí předmětu, mezi které patří:
- Domény
- Kvalita dat
- Využití dat
- Obchodní možnosti
- Aplikační funkce
- Informace o technické architektuře
- Provozní události
- Metadata organizace
- Metadata vlastnictví aplikace
- Informace o poloze
- Informace o správě životního cyklu aplikace