Sdílet prostřednictvím


Standardy metadat

Správa metadat hraje zásadní roli v architektuře dat. Metadata jsou data o jiných datech. Popisuje data a poskytuje odkaz, který vám pomůže najít, zabezpečit a řídit data. Metadata také spojují data. Dá se použít k ověření integrity a kvality dat, směrování nebo replikaci dat do nového umístění, transformace dat a pochopení významů dat. Metadata jsou také nezbytná pro demokratizaci dat prostřednictvím samoobslužných portálů.

V oboru je stále rostoucí trend, který přibližuje datové přehledy datovým analytikům a vědcům pomocí portálů, které používají více metadat. Tento trend se označuje jako pozorovatelnost dat. Pozorovatelnost dat používá koncepty, jako jsou metadata lake, grafy znalostí nebo grafy metadat, k popisu platforem, kde jsou metadata centralizovaná. Je to dobrý způsob, jak vytvořit jednotný přehled o tom, jak se data používají a zdrojují v celé organizaci při použití distribuované datové sítě.

Dobrá strategie správy metadat roste ekologicky. Začíná jednoduchým a malým tím, že nejprve identifikuje nejdůležitější oblasti. Služba a jasné procesy podporují také dobrou strategii správy metadat. Abyste mohli začít, je dobré vědět o různých kategoriích metadat:

  • Obchodní metadata popisují všechny aspekty používané pro zásady správného řízení, hledání a pochopení dat. Mezi známé příklady patří obchodní termíny a definice a informace o vlastnictví, využití a původu dat.
  • Technická metadata popisují strukturální aspekty dat v době návrhu. Mezi známé příklady patří informace o schématu, formát dat a informace o protokolu a šifrovací a dešifrovací klíče.
  • Provozní metadata popisují aspekty zpracování dat za běhu. Mezi známé příklady patří informace o procesu, doba provádění, informace o selhání procesu a ID úloh.
  • Sociální metadata popisují perspektivu uživatele dat od jejich příjemců. Mezi známé příklady patří použití a informace o sledování uživatelů, data výsledků hledání, filtry a kliknutí, zobrazení času, přístupy k profilu a komentáře.

V decentralizované architektuře dat je správa metadat organizační výzvou, která vyžaduje nalezení rovnováhy mezi centrálně spravovanými metadaty a federovanými spravovanými metadaty. Při plánování správy metadat je důležité porozumět týmům a funkcím pro analýzy na úrovni cloudu v Azure. Použití praxe správy dat pro spolupráci může zlepšit automatizaci komunikace, integrace a toku dat mezi vašimi týmy. Některé složitosti správy metadat můžete vyřešit tím, že dosáhnete správné rovnováhy mezi centrálními zásadami správného řízení a vlastnictvím domény.

Při rozhodování, která metadata chcete spravovat centrálně nebo sdílet do vašich datových domén, a při zahájení implementace si položte následující otázky:

  • Jaká obchodní metadata jsou důležitá?
  • Jaká technická metadata se vyžadují pro interoperabilitu?
  • Jaké procesy a streamy data zachycují?
  • Kde jsou modely nebo schémata vytvořená a udržovaná?
  • Jaké informace musí týmy poskytovat centrálně, aby oddělení zásad správného řízení dat fungovalo správně?

Pomocí odpovědí na tyto otázky namapujte životní cyklus obsahu pro každý datový proud metadat a určete všechny závislosti. Pak máte model metadat, který může propojit obchodní domény, procesy, technologie a data.

Jakmile víte, která metadata potřebujete, musíte zvolit místo, kam ho chcete uložit a zpracovat. K tomu můžete použít Microsoft Purview.

Použití Microsoft Purview ke správě datových aktiv ve velkém

Microsoft Purview je jednotné řešení zásad správného řízení dat, které vám pomůže spravovat a řídit místní data, multicloudová data a data saaS (software jako služba). Spravuje metadata ve velkém měřítku, protože je to plně automatizovaná služba, která inteligentně provádí zjišťování dat, prohledávání dat, kvalitu dat a správu přístupu. Poskytuje také holistickou mapu s mnoha přehledy o architektuře datových sítí.

Microsoft Purview je komplexní sada řešení, která můžou vaší organizaci pomoct řídit, chránit a spravovat data bez ohledu na to, kde se nacházejí. Řešení Microsoft Purview poskytují integrované pokrytí a pomáhají řešit fragmentaci dat napříč organizacemi, nedostatek viditelnosti, která brání ochraně a zásadám správného řízení dat a rozmazaní tradičních rolí správy IT.

Microsoft Purview kombinuje řešení a služby zásad správného řízení dat a služeb do sjednocené platformy, která vaší organizaci pomůže:

  • Získání přehledu o datech v celé organizaci
  • Chraňte a spravujte citlivá data v celém jejich životním cyklu, ať už se nacházejí kdekoli.
  • Bezproblémové řízení dat novými a komplexními způsoby
  • Správa kritických rizik dat a zákonných požadavků

Při implementaci Microsoft Purview nepoužívejte příliš mnoho změn a složitosti rychle. Technická metadata tvoří základ Microsoft Purview. Před pochopením musíte shromáždit a uspořádat metadata.

Jakmile budete mít metadata, začněte základy:

  • Obchodní podmínky
  • Seznamy autoritativních zdrojů dat
  • Seznamy databází
  • Domény zásad správného řízení
  • Informace o schématu
  • Vlastnictví dat
  • Správa dat
  • Zabezpečení
  • Kvalita dat

Pak můžete škálovat pomalým zapojením dalších vlastníků domén a správy dat a přidáním dalších klasifikací a popisků citlivosti. Tyto doplňky zlepšují vyhledávání a umožňují lepší správu přístupu k datům.

Microsoft Purview nabízí funkci označovanou jako domény zásad správného řízení, která stanovuje hranice pro jednotné zásady správného řízení, vlastnictví a zjišťování datových produktů a obchodních konceptů v rámci architektury orientované na doménu. Další informace naleznete v tématu domény zásad správného řízení v Microsoft Purview.

Vytvoření znalostního grafu pomocí služby Azure Cosmos DB

Řešení přehledu dat musí popsat způsob použití dat a vztahy mezi entitami, jako jsou zdrojová data a datové produkty, a mezi datovými produkty z jedné domény a závislými produkty z jiné domény. K modelování těchto vztahů můžete použít grafovou databázi nebo vlastní uživatelské rozhraní.

Pokud chcete vytvořit jednotné zobrazení dat vaší organizace s vlastním uživatelským prostředím, zvažte použití služby Azure Cosmos DB. Azure Cosmos DB je globálně distribuovaná databázová služba s více modely s koncovými body NoSQL. Poskytuje službu grafové databáze prostřednictvím služby Azure Cosmos DB pro Apache Gremlin, která dokáže ukládat masivní grafy s miliardami vrcholů a hran.

Konečným výsledkem architektury Azure Cosmos DB je celoorganizovaný graf, který poskytuje jednotné zobrazení všech dat ve vaší organizaci s kompletním kontextem. Jezero metadat není jen o ukládání informací. Také aktivně organizuje metadata jako graf tím, že je připojí k dalším službám a nástrojům. Tento uspořádaný graf umožňuje křížově korelovat mnoho oblastí předmětu, mezi které patří:

  • Domény
  • Kvalita dat
  • Využití dat
  • Obchodní možnosti
  • Aplikační funkce
  • Informace o technické architektuře
  • Provozní události
  • Metadata organizace
  • Metadata vlastnictví aplikace
  • Informace o poloze
  • Informace o správě životního cyklu aplikace

Další kroky