Sdílet prostřednictvím


Úvod do analýz v cloudovém měřítku

Analýzy v cloudovém měřítku vycházejí z cílových zón Azure, které usnadňují nasazení a zásady správného řízení. Hlavním účelem cílové zóny Azure je zajistit, aby se v případě, že aplikace nebo úloha v Azure nachází, už požadovaná infrastruktura proběhla. Než nasadíte cílovou zónu analýzy na úrovni cloudu, musíte už projít architekturou přechodu na cloud a nasadit architekturu cílové zóny Azure s cílovými zónami platformy.

V případě suverénních úloh má Microsoft Sovereign Landing Zone (SLZ), což je varianta cílové zóny Azure na podnikové úrovni, která je určená pro organizace, které potřebují pokročilé suverénní kontroly. Analýzy na úrovni cloudu je možné nasadit na tuto variantu cílové zóny Azure.

Analýza na úrovni cloudu zahrnuje nasazení do cílových zón aplikací. Tyto zóny se obvykle nacházejí ve skupině pro správu cílové zóny s filtrováním zásad na ukázkové šablony poskytované Microsoftem.

Microsoft poskytuje ukázkové šablony, které vám pomůžou začít, které můžete použít pro nasazení data lakehouse a datových sítí .

Vyhodnocení analýzy na úrovni cloudu

Firma často hledá přehledné nebo popisné pokyny, než začne promítat technické podrobnosti pro konkrétní případ použití, projekt nebo komplexní analýzu v cloudovém měřítku. Vzhledem k tomu, že firma formuluje svou celkovou strategii pro data, může být náročné zajistit, aby v rozsahu současného použití zvažuje všechny strategické a požadované zásady.

Aby se urychlila realizace této ucelené cesty s přehledy, a zároveň si tyto výzvy uvědomovala, microsoft vyvinul preskriptivní scénář pro analýzy v cloudovém měřítku. Je v souladu s klíčovými motivy probíranými při vývoji plánu pro analýzy v cloudovém měřítku.

Analýzy v cloudovém měřítku vycházejí z architektury přechodu na cloud od Microsoftu a používají objektiv architektury Microsoft Azure Well-Architected Framework. Architektura přechodu na cloud od Microsoftu poskytuje podrobné pokyny a osvědčené postupy pro cloudové provozní modely, referenční architekturu a šablony platforem. Vychází z reálných učení z některých z našich nejnáročnějších, sofistikovaných a složitých prostředí.

Analýza na úrovni cloudu zpevňuje způsob, jak zákazníci vytvářet a zprovozňovat cílové zóny pro hostování a spouštění analytických úloh. Cílové zóny vytváříte na základech zabezpečení, zásad správného řízení a dodržování předpisů. Jsou škálovatelné a modulární a zároveň podporují autonomii a inovace.

Historie architektury dat

Na konci roku 1980 byla zavedena generace datového skladu 1, která zkombinovala různorodé zdroje dat z celého podniku. Na konci roku 2000 přišla Generace2 se zavedením ekosystémů velkých objemů dat, jako je Hadoop a datové jezero. V polovině roku 2010 přinesla cloudovou datovou platformu. Bylo to podobné předchozím generacím, ale s zavedením příjmu streamovaných dat, jako jsou architektury kappa nebo lambda. Na začátku roku 2020 se zavedly koncepty datových jezer, datových sítí, datových prostředků infrastruktury a provozních vzorů orientovaných na data.

I přes tyto pokroky mnoho organizací stále používá centralizovanou monolitickou platformu generace 1. Tento systém funguje dobře, až do chvíle. Kritické body však mohou nastat kvůli vzájemným procesům, úzce propojeným komponentám a hyperspecializovaným týmům. Úlohy extrakce, transformace a načítání (ETL) můžou být výrazné a zpomalují časové osy doručení.

Datový sklad a datové jezero jsou stále cenné a hrají důležitou roli v celkové architektuře. V následující dokumentaci jsme zdůraznili některé problémy, ke kterým může dojít při použití těchto tradičních postupů ke škálování. Tyto výzvy jsou obzvláště relevantní v komplexní organizaci, kde se mění zdroje dat, požadavky, týmy a výstupy.

Přechod na analýzy v cloudovém měřítku

Aktuální architektura analytických dat a provozní model mohou zahrnovat datové sklady, datová jezera a datové lakehouse struktury, datovou infrastrukturu nebo datovou síť.

Každý datový model má své vlastní výhody a výzvy. Analýzy na úrovni cloudu vám pomůžou pracovat z aktuálního nastavení a přesunout přístup ke správě dat, aby se mohl vyvíjet s vaší infrastrukturou.

Můžete podporovat libovolnou datovou platformu a scénář a vytvořit ucelenou architekturu pro analýzu v cloudovém měřítku, která slouží jako základ a umožňuje škálování.

Moderní datová platforma a požadované výsledky

Jednou z prvních zaměřených oblastí je aktivovat strategii dat, která bude vyhovovat vašim výzvám iterativním vytvořením škálovatelné a agilní moderní datové platformy.

Místo toho, abyste byli zahlceni lístky služeb a snažili se splnit konkurenční obchodní potřeby, umožňuje moderní datová platforma hrát užitečnější roli tím, že vám uvolní čas soustředit se na cennější práci. Poskytujete obchodní řady s platformou a systémy pro samoobslužné potřeby dat a analýz.

Doporučené oblasti počátečního zaměření jsou:

  • Zlepšit kvalitu dat, usnadnit důvěru a získat přehledy o obchodních rozhodnutích řízených daty.
  • Bezproblémově implementujte celostní data, správu a analýzy ve velkém měřítku ve vaší organizaci.
  • Vytvořte robustní zásady správného řízení dat, které umožňují samoobslužné a flexibilní obchodní řady.
  • Udržujte zabezpečení a dodržování právních předpisů v plně integrovaném prostředí.
  • Rychle vytvořte základ pro pokročilé analytické funkce s předefinovaným řešením dobře navržených, opakovatelných modulárních vzorů.

Řízení analytických aktiv

Druhým aspektem je určit, jak organizace implementuje zásady správného řízení dat.

Zásady správného řízení dat zajišťují, že data, která používáte ve svých obchodních operacích, sestavách a analýze, jsou zjistitelná, přesná, důvěryhodná a můžou být chráněná.

U mnoha společností očekáváme, že data a AI budou mít konkurenční výhodu. V důsledku toho se vedení snaží sponzorovat iniciativy umělé inteligence v jejich odhodlání stát se řízenými daty. Aby se ale AI stala efektivní, musí být data, která používá, důvěryhodná. Jinak může být ohrožena přesnost rozhodování, rozhodnutí mohou být zpožděna nebo mohou být zmeškány akce, což může ovlivnit výsledné hospodaření. Společnosti nechtějí, aby kvalita jejich dat byla špatný vstup, špatný výstup. Zpočátku se může zdát jednoduché opravit kvalitu dat, dokud nepřihlédnete k dopadu, který digitální transformace měla na data.

Díky tomu, že se data šíří napříč hybridním multicloudem a distribuovanými daty, organizace se snaží zjistit, kde jsou jejich data, a řídit je. Neplánovaná data můžou mít značný vliv na firmu. Špatná kvalita dat má vliv na obchodní operace, protože chyby v datech způsobují chyby procesu a zpoždění. Špatná kvalita dat má vliv také na obchodní rozhodování a schopnost zůstat v souladu s předpisy. Zajištění kvality dat ve zdroji se často upřednostňuje, protože oprava problémů s kvalitou analytického systému může být složitější a nákladnější než použití pravidel kvality dat v rané fázi příjmu dat. Pro usnadnění sledování a řízení aktivit dat musí zásady správného řízení dat zahrnovat:

  • Zjišťování dat
  • Kvalita dat
  • Vytvoření zásad
  • Sdílení dat
  • Metadata

Zabezpečení analytických aktiv

Dalším důležitým faktorem zásad správného řízení dat je ochrana dat. Ochrana dat vám může pomoct s dodržováním právních předpisů a zabránit únikům dat. Ochrana osobních údajů a rostoucí počet porušení zabezpečení dat učinily ochranu dat nejvyšší prioritou ve vedení společnosti. Tato porušení zabezpečení zvýrazňují riziko pro citlivá data, jako jsou identifikovatelná zákaznická data. Důsledky porušení ochrany osobních údajů nebo porušení zabezpečení dat jsou mnohé a můžou zahrnovat:

  • Ztráta nebo vážné poškození image značky
  • Ztráta důvěry zákazníků a podílu na trhu
  • Pokles ceny podílu, který má vliv na návratnost investic a platů vedoucích pracovníků
  • Závažné finanční sankce kvůli selhání auditu nebo dodržování předpisů
  • Právní řízení
  • Dominový účinek porušení zabezpečení, například zákazníci by se mohli stát obětí krádeže identity.

Ve většině případů musí veřejně citované společnosti tyto porušení deklarovat. Pokud dojde k porušení zabezpečení, budou zákazníci pravděpodobně vinit společnost jako první, a ne hacker. Zákazník může společnost několik měsíců bojkotovat nebo se nikdy nevrátí.

Nedodržování právních předpisů týkajících se ochrany osobních údajů v datech může vést k významným finančním sankcím. Řízení dat vám pomůže vyhnout se takovým rizikům.

Provozní model a výhody

Přechod na platformu moderní datové strategie nemění jenom technologii, kterou vaše organizace používá, ale také způsob fungování.

Analýzy na úrovni cloudu poskytují předepsané pokyny, které vám pomůžou zvážit, jak organizovat a zručovat vaše lidi a týmy, včetně následujících:

  • Definice osob, rolí a zodpovědností
  • Navrhované struktury pro agilní, vertikální a multidoménové týmy
  • Materiály pro dovednosti, včetně dat Azure a certifikací AI prostřednictvím Microsoft Learn

Je také důležité zapojit koncové uživatele během procesu modernizace a s tím, jak budete dále vyvíjet svoji platformu a nasadíte nové případy použití.

Architektury

Cílové zóny Azure představují strategickou cestu návrhu a cílový technický stav vašeho prostředí. Umožňují snadné nasazení a zásady správného řízení, aby poskytovaly větší flexibilitu a dodržování předpisů. Cílové zóny Azure také zajišťují, že když se ve vašem prostředí objeví nová aplikace nebo úloha, je už správná infrastruktura. Správa dat Azure a cílové zóny dat, integrované s řešeními zásad správného řízení a analýzy softwaru jako služby Od Microsoftu, jsou navrženy s těmito stejnými základními principy a v kombinaci s dalšími prvky analýzy v cloudovém měřítku vám můžou pomoct:

  • Samoobslužná služba
  • Škálovatelnost
  • Rychlý start
  • Zabezpečení
  • Ochrana osobních údajů
  • Optimalizované operace

Cílová zóna správy dat

Cílová zóna správy dat poskytuje základ pro centralizované zásady správného řízení a správu dat vaší platformy v rámci vaší organizace. Usnadňuje také komunikaci s ingestováním dat z celého digitálního majetku, včetně multicloudové a hybridní infrastruktury.

Cílová zóna správy dat podporuje řadu dalších možností správy dat a zásad správného řízení, například:

  • Katalog dat
  • Správa kvality dat
  • Klasifikace dat
  • Rodokmen dat
  • Úložiště modelování dat
  • Katalog rozhraní API
  • Sdílení dat a kontrakty

Tip

Pokud používáte partnerová řešení pro katalog dat, správu kvality dat nebo možnosti rodokmenu dat, měly by se nacházet v cílové zóně správy dat. Alternativně je možné Microsoft Purview nasadit jako řešení typu software jako služba a připojit se k cílové zóně správy dat i cílovým zóně dat.

Cílové zóny dat

Cílové zóny dat přinesou data blíže uživatelům a umožňují samoobslužnou správu při zachování společné správy a zásad správného řízení prostřednictvím připojení k cílové zóně správy dat.

Hostují standardní služby, jako jsou sítě, monitorování, příjem dat a zpracování, a také přizpůsobení, jako jsou datové produkty a vizualizace.

Cílové zóny dat jsou klíčem k povolení škálovatelnosti vaší platformy. V závislosti na velikosti a potřebách vaší organizace můžete začít s jednou nebo několika cílovými zónami.

Při rozhodování mezi jednou a více cílovými zónami zvažte regionální závislosti a požadavky na rezidenci dat. Existují například místní zákony nebo předpisy, které vyžadují, aby data zůstala v určitém umístění?

Bez ohledu na počáteční rozhodnutí můžete podle potřeby přidávat nebo odebírat cílové zóny dat. Pokud začínáte s jednou cílovou zónou, doporučujeme naplánovat rozšíření na několik cílových zón, abyste se vyhnuli budoucím potřebám migrace.

Poznámka:

Kde bylo nasazeno Microsoft Fabric, cílová zóna dat hostuje řešení mimo typu software jako služba, jako jsou datová jezera a jiné datové služby Azure.

Další informace o cílových zónách najdete v tématu Cílové zóny Azure pro analýzy v cloudovém měřítku.

Závěr

Po přečtení této sady dokumentace, zejména v částech věnovaném zásadám správného řízení, zabezpečení, provozu a osvědčeným postupům, doporučujeme nastavit prostředí pro testování konceptu pomocí šablon nasazení. Tyto šablony spolu s pokyny k architektuře poskytují praktické zkušenosti s některými technologiemi Azure a softwaru jako služby Od Microsoftu. Další informace najdete v kontrolním seznamu Začínáme.

Další kroky