Přechodová zóna pro správu dat
Cílová zóna pro správu dat je správcovská funkce, která je klíčová pro analytiku v rozsahu cloudu. Zodpovídá za zásady správného řízení vaší analytické platformy.
Cílová zóna správy dat je samostatné předplatné se stejnými standardními službami cílové zóny Azure. Umožňuje správu dat prostřednictvím crawlerů, které se připojují k datovým jezerům a polyglotnímu úložišti v cílových zónách pro data. Partnerský vztah virtuální sítě propojuje cílovou zónu správy dat s cílovými zónami dat a předplatným připojení.
Tato architektura je výchozím bodem a při plánování implementace cílové zóny správy dat ji můžete upravit tak, aby vyhovovala vašim konkrétním obchodním a technickým požadavkům.
Poznámka:
Polyglotní perzistence je termín úložiště, který popisuje výběr mezi různými technologiemi úložiště dat, které podporují různé typy dat a jejich potřeby ukládání. Polyglotní trvalost je v podstatě koncept, který může aplikace používat více než jednu základní databázi nebo technologii úložiště.
Důležité
Cílová zóna správy dat se musí nasadit jako samostatné předplatné v rámci skupiny pro správu s příslušnými zásadami správného řízení. Pak můžete řídit zásady správného řízení v rámci vaší organizace. Akcelerátor cílové zóny Azure ukazuje, jak byste měli přistupovat k cílovým zónám Azure.
Zásady správného řízení dat
Cloud Scale Analytics navrhuje používat Microsoft Purview. Alternativně je možné nasadit partnerová řešení Microsoftu pro správu konkrétních funkcí zásad správného řízení dat. Mezi klíčové funkce, které je potřeba vzít v úvahu ve vaší architektuře, patří globální katalog dat, správa hlavních dat, sdílení a kontrakty dat, katalog rozhraní API, správa kvality dat a úložiště modelování dat.
Produkty zásad správného řízení dat partnerů Microsoftu, které potřebují nasazení v předplatném, by se měly nasadit do skupiny prostředků Zásad správného řízení dat v cílové zóně správy dat.
Katalog dat
Katalog dat zaregistruje a udržuje informace o datech v centralizované oblasti a zpřístupňuje je pro organizaci. Zajišťuje, aby podniky zabránily duplicitním datovým produktům způsobeným redundantním příjmem dat různými projektovými týmy. Doporučujeme vytvořit službu katalogu dat pro definování metadat datových produktů uložených v cílových zónách dat.
Analýza na úrovni cloudu závisí na Microsoft Purview, aby registrovala podnikové zdroje dat, klasifikovala je, zajistila kvalitu dat a nabízela zabezpečený samoobslužný přístup.
Microsoft Purview je služba založená na tenantovi a může komunikovat s každou cílovou zónou dat vytvořením spravované virtuální sítě nasazené do oblasti cílových zón dat. Prostředí AZURE Managed Virtual Network Integration Runtime (IR) můžete nasadit v rámci spravovaných virtuálních sítí Microsoft Purview v libovolné dostupné oblasti Microsoft Purview. Odtud může prostředí IR spravované virtuální sítě používat privátní koncové body k bezpečnému připojení a kontrole podporovaných zdrojů dat. Další informace najdete v tématu Použití spravované virtuální sítě s účtem Microsoft Purview. Vytvoření prostředí IR spravované virtuální sítě ve spravované virtuální síti zajišťuje izolaci a zabezpečení procesu integrace dat.
Pokud používáte Azure Databricks, doporučujeme kromě Microsoft Purview používat azure Databricks Unity Catalog. Azure Databricks Unity Catalog poskytuje centralizované řízení přístupu, auditování, rodokmen a možnosti zjišťování dat v pracovních prostorech Databricks. Osvědčené postupy pro nastavení katalogu Unity najdete v tématu osvědčené postupy katalogu Unity.
Poznámka:
I když se tato dokumentace zaměřuje především na používání Microsoft Purview pro zásady správného řízení, podniky můžou investovat do jiných produktů, jako je Alation, Okera nebo Collibra. Tato řešení jsou založená na předplatném a doporučujeme je nasadit do cílové zóny správy dat. Mějte na paměti, že může být vyžadována nějaká vlastní integrace.
Správa hlavních dat
Řízení správy hlavních dat se nachází v cílové zóně správy dat. Správa hlavních dat v datové síti obsahuje specifické aspekty, které byste měli zvážit pro síť dat.
Řada řešení pro správu hlavních dat se plně integruje s Microsoft Entra ID. Tato integrace umožňuje zabezpečit data a poskytovat různá zobrazení pro různé skupiny uživatelů.
Další informace naleznete v tématu Hlavní systém správy dat.
Sdílení dat a kontrakty
Analýzy v cloudu používají správu nároků Microsoft Entra nebo zásady Microsoft Purview k řízení přístupu ke sdílení dat. I tak můžete i nadále vyžadovat úložiště pro sdílení a kontrakty. Toto úložiště je organizační funkce a měla by se nacházet v cílové zóně správy dat.
Vaše smlouvy by měly poskytovat informace o ověřování dat, modelech a zásadách zabezpečení.
Další informace najdete v tématu datové kontrakty.
Katalog rozhraní API
Týmy datových aplikací vytvářejí pro své datové aplikace různá rozhraní API. Tato rozhraní API můžou být obtížná při zjišťování v celé organizaci. Tento problém může vyřešit umístění katalogu rozhraní API do cílové zóny správy dat.
Katalog rozhraní API vám může pomoct standardizovat dokumentaci a nabízí místo pro interní spolupráci na rozhraních API. Může také řídit spotřebu, publikování a řízení zásad správného řízení ve vaší organizaci.
Správa kvality dat
Pokračujte v aktuálním řešení.
Spravujte kvalitu dat co nejblíže zdroji dat, abyste zabránili problémům s kvalitou v šíření napříč analytickými systémy a systémy AI. Díky integraci metrik kvality a ověřování do procesů dat vyrovnáte správu kvality s týmy, které jsou s daty obeznámené, a tím zajistíte hlubší porozumění a lepší zpracování datových prostředků.
Rodokmen dat také poskytuje jistotu kvality dat a měli byste ji poskytnout pro všechny datové produkty.
Další informace o správě kvality dat najdete v tématu Kvalita dat.
Úložiště modelování dat
Modely vztahů entit byste měli zachytávat a ukládat do centrálního umístění v cílové zóně správy dat a poskytovat tak uživatelům dat jediné místo, kde najdete koncepční diagramy.
Mnoho zákazníků používá ER Studio a OrbusInfinity k modelování svých datových produktů před příjmem dat.
Vrstva služby
Vaše organizace se může rozhodnout vytvořit mnoho automatizačních služeb pro rozšíření možností analýzy v cloudovém měřítku. Tyto automatizační služby řídí řešení shody a onboardingu pro váš analytický stav.
Pokud se rozhodnete tyto automatizační služby sestavit, měli byste mít uživatelské rozhraní, které funguje jako datové marketplace i konzola operací. Toto rozhraní by mělo spoléhat na základní úložiště metadat, jako jsou standardy metadat .
Váš datový marketplace nebo konzola Operations Console volá střední vrstvu mikroslužeb, která usnadňuje onboarding, registraci metadat, zřizování zabezpečení, životní cyklus dat a pozorovatelnost.
Pro hostování úložiště metadat můžete zřídit vrstvu služby skupinu prostředků.
Důležité
Žádné z těchto automatizačních služeb nejsou produkty a nezobrazují žádnou položku plánu. Zobrazí se seznam, který vám pomůže zvážit, které položky byste mohli chtít automatizovat.
Služba | Obor služby |
---|---|
Zřizování cílových zón dat | Tato služba vytvoří novou cílovou zónu dat. Je nepravděpodobné, že bude mít vysoké využití, ale je zahrnuto pro úplnost end-to-end řešení onboardingu. Další informace najdete v tématu Zřizování analýz na úrovni cloudu. |
Onboarding datového produktu | Tato služba vytvoří a změní skupiny prostředků, které se týkají onboardovaného tenanta. Obsahuje také možnosti upgradu a downgradu skladových položek a aktivaci a deaktivaci skupin prostředků pro všechny nasazené tenanty nebo služby. Vytvoří novou cílovou zónu dat DevOps. Další informace najdete v tématu Zřizování analýz na úrovni cloudu. |
Příjem dat nezávislý na datech | Tato mikroslužba vytváří nové zdroje dat pro příjem dat do cílových zón dat tím, že komunikuje s metastorem služby Azure Data Factory SQL Database v každé cílové zóně dat. Další informace najdete v tématu Jak automatizované architektury příjmu dat podporují analýzy na úrovni cloudu v Azure. |
Metadata | Tato služba zveřejňuje a vytváří metadata pro platformu. Další informace najdete v tématu Standardy metadat. |
Zřizování přístupu | Tato služba vytváří přístupové balíčky, zásady přístupu a procesy schvalování přístupu k prostředkům (ruční nebo automatické) pomocí SPN/UPN. Může také zveřejnit rozhraní API, které poskytne seznam žádostí o předplatné (aktiv), které uživatelé odeslali za posledních 90 dnů. Další informace najdete v tématu Správa přístupu k datům. |
Životní cyklus dat | Tato služba zodpovídá za udržování životního cyklu dat na základě metadat. Tato údržba může zahrnovat přesun dat do studeného úložiště a odstranění záznamů, které už není potřeba uchovávat. Další informace najdete v tématu Správa životního cyklu dat. |
Onboarding datové domény | VZTAHUJE SE POUZE NA DATOVOU SÍŤ. Tato služba zaznamenává metadata týkající se nových domén a podle potřeby nasadí nové domény. Může také vytvářet, aktualizovat, aktivovat a deaktivovat jakoukoli doménu nebo řádek služby, který můžete integrovat do mikroslužby. Další informace najdete v tématu Zřizování analýz na úrovni cloudu. |
Azure Container Registry
Cílová zóna správy dat hostuje službu Azure Container Registry. Azure Container Registry umožňuje operacím datové platformy nasazovat standardní kontejnery pro použití v projektech datových věd, které týmy datových aplikací využívají.