Technologie Azure pro proces učení

Dokončeno

V této jednotce se dozvíte, jak použít výsledky kroku měření v životním cyklu inovací. Dozvíte se také o důležitosti demokratizace dat.

Demokratizace dat

Jak jste se naučili v předchozích lekcích, můžete shromažďovat data od zákazníků pomocí více zdrojů. Mezi tyto zdroje patří mikroprůzkumy, data o využití od Azure Application Insights a přepínače funkcí, o kterých se zákazníci můžou rozhodnout sami, že je povolí nebo zakážou. Čím více dat máte, tím lépe se rozhodujete, ale potřebujete způsob, jak tento stále rostoucí tok dat zvládnout.

V roce 2014 Satya Nadella mluvil o důležitosti datové kultury v organizaci. Řekl, že rozhodnutí by neměla být učiněna na základě pocitů nebo subjektivních názorů, ale pomocí dat k jejich ověření. Řekl také, že data by měla být dostupná každému člověku, který je potřebuje, a měly by se snadno převést na užitečné přehledy, které usnadňují rozhodování řízená daty.

Organizace může provádět trvalá rozhodnutí o datech pouze v případě, že jsou tato rozhodnutí založená na solidní a přístupné datové platformě. Toto úsilí zahrnuje čtyři oblasti:

  • Shromažďování dat: Prvním krokem k rozhodování na základě dat je vždy mít data. Shromažďování dat může mít různé formy: migraci z existujících úložišť dat, generování dat ze zdrojů, jako je Azure Application Insights, nebo příjem dat z jiných zdrojů.
  • Sdílet data: Shromážděná data musí být dostupná všem uživatelům, kteří je potřebují, nejen odborníkům na data. Všichni jednotlivci v organizaci by měli mít možnost používat data k rozhodování.
  • Centralizované datové: Centralizované datové platformy mohou pomoci zjednodušit sdílení dat a správu dat.
  • řízení dat: Sdílení dat neznamená, že všechna data musí být dostupná všem. Před sdílením se ujistěte, že jsou všechna citlivá data zabezpečená, sledována a řízená.

Datová platforma Azure

Platforma Azure pokrývá celý životní cyklus dat, který je zásadní pro rozhodování na základě dat a demokratizaci dat. Od jednoduchých databází na vyžádání až po masivní datové sklady nebo flexibilní systémy NoSQL vám datová platforma Azure umožňuje pokrýt čtyři oblasti datových aktivit.

Sběr dat

Ekosystém dat Azure zahrnuje služby a nástroje pro migraci, příjem, ukládání a analýzu dat. Následující seznam ukazuje pouze několik mechanismů, které můžete použít ke zpracování dat a zpřístupnit je pro pozdější sdílení, aby bylo možné usnadnit rozhodování řízené daty:

  • analýzy dat: Azure Synapse Analytics je podniková analytická služba, která urychluje získávání poznatků z datových skladů a systémů pro velké objemy dat. Azure Synapse Analytics spojuje to nejlepší z těchto možností:
    • Technologie SQL používané v podnikových datových skladech
    • Technologie Sparku používané pro velké objemy dat
    • Kanály pro integraci dat a ETL (extrakce, transformace, načtení) a ELT (extrakce, načtení, transformace).
    • Hloubková integrace s dalšími službami Microsoftu, jako jsou Power BI, Azure Cosmos DB a Azure Machine Learning.
  • migrace dat: Data už můžou být uložená ve stávajících zdrojích, ale je potřeba je migrovat na moderní platformu, než je možné je převést na užitečné přehledy. azure Database Migration Service obsahuje nástroje, které pomáhají s migrací dat ze systémů, jako jsou SQL Server, PostgreSQL, Oracle a MongoDB.
  • zpracování dat: Azure zahrnuje služby pro analýzu a transformaci datových proudů pomocí azure Stream Analyticsa spouštění procesů ETL ve velkém měřítku s azure Data Factory.

Sdílení dat

Microsoft Power BI je sada nástrojů, které konsolidují data pocházející z různorodých zdrojů do integrovaných interaktivních vizualizací. Uživatelé se můžou ponořit do dat jenom pomocí intuitivních ovládacích prvků. Síla přehledů je dostupná všem v organizaci, nejen odborníkům na data.

Vlastníci oblastí můžou vytvářet sestavy a řídicí panely, které obsahují relevantní informace ohledně specifických aspektů aplikace. Po zavedení nové funkce pro ověření hypotézy jsou data snadno dostupná k ověření nebo odmítnutí hypotézy na základě skutečného využití zákazníků.

Microsoft Power BI vám může pomoct se sdílením dat z různých úhlů pohledu. Tady je několik příkladů:

  • Sdílení dat se spolupracovníky a partnery: Řídicí panely Power BI zjednodušují využívání dat. Vizualizace umožňují lidem, kteří nejsou odborníky na data, přejít k podrobnostem o datech, aniž by se museli seznámit se základní strukturou.
  • Rychlé generování přehledů dat: Power BI může automaticky generovat vizualizace datových sad pomocí funkcí Rychlé přehledy. Řídicí panely můžete rychle vytvořit a najít korelace dat, které nemusí být zpočátku zřejmé.
  • Vložit sestavy na web nebo portál: S Power BI máte přístup nejen k vizualizacm na nativním portálu Power BI, ale můžete vkládat i sestavy a řídicí panely do jiných webových aplikací. Uživatelé tak nemusí opustit známé firemní weby, aby našli data, která potřebují pro rozhodovací proces.

Centralizace dat

Hlavním problémem centralizace dat je škálování na různých úrovních. S rizikem zjednodušování to můžeme zredukovat na 3 Vvelkých dat:

  • Svazek: Azure Data Lake Storage Gen2 je nákladově efektivní a škálovatelná platforma Azure pro ukládání dat. Na základě masivní škálovatelnosti poskytované službou Azure Storage byla služba Azure Data Lake Storage navržená tak, aby poskytovala více petabajtů informací a současně udržovala stovky gigabitů propustnosti.
  • Různorodost: Tento termín často označuje skutečnost, že data nejsou vždy strukturovaná. Můžete mít také částečně strukturovaná a dokonce nestrukturovaná data. Azure Synapse v této oblasti svítí, protože spojuje nejlepší technologie SQL používané v podnikových datových skladech se Sparkem, které se často používají pro velké objemy dat.
  • rychlost: Problém, který se často vyskytuje ve starších architekturách dat, je vzájemným vztahem mezi kapacitou úložiště, rychlostí analýzy a rychlostí příjmu dat. V datových řešeních Azure může organizace nezávisle škálovat různé dimenze platformy jejich oddělením. Data je možné ingestovat, zpracovávat a sdílet prostřednictvím datových kanálů, které používají požadované datové služby Azure, jak ukazuje architektura podnikové business intelligence.

Zásady správného řízení dat

V dnešním světě data představují kritický prostředek i významnou odpovědnost. Uložená data často obsahují důvěrné informace, které můžou vést k finančním nebo osobním škodám, pokud dojde k úniku nebo sdílení nevhodným způsobem. Ukládání a zpracování dat implicitně znamená, že organizace přijímá odpovědnost. Právní předpisy mohou vyústit v sankce pro organizace, které nesprávně nakládají s osobními nebo důvěrnými údaji.

V důsledku toho je zásady správného řízení dat důležité pro všechny organizace, které mají cíl demokratizace dat. Prvním krokem směrem k zásadám správného řízení dat je klasifikace dat, která je potřeba zpracovávat určitými způsoby. Microsoft například interně používá pro klasifikaci dat tyto kategorie dat:

  • neobchodní: Data z vašeho osobního života, která nepatří do Microsoftu.
  • veřejné: Obchodní data, která jsou volně dostupná a schválená pro veřejnou spotřebu.
  • Obecné: Obchodní data, která nejsou určená pro veřejnou cílovou skupinu.
  • důvěrné: Obchodní data, která můžou způsobit škodu Společnosti Microsoft, pokud jsou sdílena.
  • vysoce důvěrné: Obchodní data, která by v případě nadměrného sdílení způsobila velké škody společnosti Microsoft.

Dalším krokem po klasifikaci dat je zajištění ochrany každé kategorie dat před neoprávněným přístupem. Azure podporuje tyto technologie, které vynucují důvěrnost:

  • šifrování neaktivních uložených dat: Všechna neaktivní uložená data Azure se šifrují při ukládání v datacentrech Microsoftu. Některé služby Azure nabízejí specifické funkce šifrování, jako je transparentní šifrování dat ve službě Azure Synapse a Azure SQL Database.
  • Šifrování dat v pohybu: Všechny datové služby Azure šifrují data pomocí protokolu TLS/SSL před odesláním prostřednictvím sítě. Některé služby, jako je Azure Storage, můžou volitelně povolit nešifrovaný provoz. Organizace by měly zakázat veškerou nešifrovanou komunikaci pro jakýkoli typ citlivých dat.
  • řízení přístupu k datům: Azure nabízí sofistikované mechanismy ověřování a autorizace pro přístup k platformě Azure i pro přístup k samotným datům. Řízení přístupu na základě role Azure, podmíněný přístupa řízení privilegované identity jsou tři příklady základních služeb, které pomáhají zajistit, aby k citlivým informacím měli přístup pouze autorizované osoby.
  • auditování dat: Řada standardů dodržování právních předpisů vyžaduje důkaz mechanismů ochrany dat tím, že zdokumentuje, kdo provedl určité operace a získal přístup k určitým datům. Jak je popsáno v Auditování pro Azure SQL Database aAzure Synapse Analytics, auditování dat v Azure zahrnuje tři aspekty auditování:
    • Zachovat záznam auditu vybraných událostí, kde můžete definovat kategorie akcí dat, které se mají auditovat.
    • sestavy o aktivitě databáze, volitelně s předem nakonfigurovanými sestavami a řídicími panely, abyste mohli rychle začít.
    • analyzovat sestavy za účelem odhalení podezřelých událostí, neobvyklé aktivity a trendů

Růst myšlení

Fáze učení někdy přináší špatné zprávy. Hypotézy, o kterých jste si mysleli, že jsou správné, se mohou ukázat jako nesprávné. Otevření alternativních nápadů je klíčem k tomu, aby proces inovací plynul. Možná byla celá hypotéza špatná, nebo možná problém byl pouze způsobem, jakým byl prototyp vyvinut.

V každém případě by měly být závěry vždy podporovány daty. Tým by měl přejít k formulaci další hypotézy, případně nějaké revize nebo iterace počáteční hypotézy.

Stávající data vám nemusí umožnit jednoznačně uzavřít, jestli byla hypotéza správná nebo špatná. V tomto případě by se měla vylepšit datová sada, která pomáhá rozhodovacímu procesu. Buď zavést nové telemetrické body v aplikaci, nebo zjistit nové způsoby získání informací o prostředí zákazníka.

Růstové myšlení je v této fázi zásadní. Představte si hypotézy, které se ukázaly jako chybné nebo částečně nesprávné, jako studijní příležitosti. Organizace by neměly ztrácet čas inovacemi, které nevygenerují očekávané obchodní výsledky.

Kam se podívat dál

Dále probereme mnoho konceptů v této lekci v dokumentaci architektury přechodu na cloud o demokratizaci dat.