Identifikace datových služeb
Microsoft Azure je cloudová platforma, která využívá aplikace a infrastrukturu IT pro některé z největších světových organizací. Zahrnuje mnoho služeb pro podporu cloudových řešení, včetně transakčních a analytických datových úloh.
Některé z nejčastěji používaných cloudových služeb pro data jsou popsány níže.
Poznámka:
Toto téma popisuje pouze některé z nejčastěji používaných datových služeb pro moderní transakční a analytická řešení. K dispozici jsou také další služby.
Azure SQL
Azure SQL je souhrnný název pro řadu relačních databázových řešení založených na databázovém stroji Microsoft SQL Serveru. Mezi konkrétní služby Azure SQL patří:
- Azure SQL Database – plně spravovaná databáze typu platforma jako služba (PaaS) hostovaná v Azure.
- Spravovaná instance Azure SQL – hostovaná instance SQL Serveru s automatizovanou údržbou, která umožňuje flexibilnější konfiguraci než Azure SQL DB, ale s větší zodpovědností za správu vlastníka.
- Virtuální počítač Azure SQL – virtuální počítač s instalací SQL Serveru, který umožňuje maximální konfigurovatelnost s plnou odpovědností za správu.
Správci databází obvykle zřizují a spravují databázové systémy Azure SQL, aby podporovaly obchodní aplikace, které potřebují ukládat transakční data.
Datoví inženýři můžou používat databázové systémy Azure SQL jako zdroje pro datové kanály, které provádějí operace extrakce, transformace a načítání (ETL) k ingestování transakčních dat do analytického systému.
Datoví analytici mohou dotazovat databáze Azure SQL přímo na vytváření sestav, i když ve velkých organizacích se data obvykle kombinují s daty z jiných zdrojů v analytickém úložišti dat za účelem podpory podnikových analýz.
Opensourcové databáze v Azure
Azure zahrnuje spravované služby pro oblíbené opensourcové relační databázové systémy, mezi které patří:
Azure Database for MySQL – jednoduchý opensourcový systém pro správu databází, který se běžně používá v aplikacích stacku Linux, Apache, MySQL a PHP (LAMP).
Azure Database for MariaDB – novější systém pro správu databází vytvořený původními vývojáři MySQL. Databázový stroj byl od té doby přepsán a optimalizován za účelem zvýšení výkonu. MariaDB nabízí kompatibilitu s Oracle Database (další oblíbený systém komerční systém pro správu databází).
Azure Database for PostgreSQL – hybridní relační objektová databáze. Data můžete ukládat v relačních tabulkách. Databáze PostgreSQL ale umožňuje ukládat i vlastní datové typy s jejich vlastními nerelačními vlastnostmi.
Stejně jako u databázových systémů Azure SQL spravují správci databází opensourcové relační databáze, které podporují transakční aplikace, a poskytují zdroj dat pro datové inženýry vytvářející kanály pro analytická řešení a datové analytiky vytvářející sestavy.
Azure Cosmos DB
Azure Cosmos DB je nerelační databázový systém (NoSQL) v globálním měřítku, který podporuje více aplikačních programovacích rozhraní (API), který umožňuje ukládat a spravovat data jako dokumenty JSON, páry klíč-hodnota, rodiny sloupců a grafy.
V některých organizacích mohou být instance Cosmos DB zřízeny a spravovány správcem databáze; i když vývojáři softwaru často spravují úložiště dat NoSQL jako součást celkové architektury aplikací. Datoví inženýři často potřebují integrovat zdroje dat Cosmos DB do podnikových analytických řešení, která podporují modelování a vytváření sestav datovými analytiky.
Azure Storage
Azure Storage je základní služba Azure, která umožňuje ukládat data do:
- Kontejnery objektů blob – škálovatelné nákladově efektivní úložiště pro binární soubory
- Sdílené složky – sdílené složky v síti, jako jsou obvykle v podnikových sítích.
- Tabulky – úložiště klíč-hodnota pro aplikace, které potřebují rychle číst a zapisovat hodnoty dat.
Datoví inženýři používají Azure Storage k hostování datových jezer – úložiště objektů blob s hierarchickým oborem názvů, který umožňuje uspořádání souborů do složek v distribuovaném systému souborů.
Azure Data Factory
Azure Data Factory je služba Azure, která umožňuje definovat a plánovat datové kanály pro přenos a transformaci dat. Kanály můžete integrovat s jinými službami Azure, abyste mohli ingestovat data z cloudových úložišť dat, zpracovávat data pomocí cloudových výpočetních prostředků a zachovat výsledky v jiném úložišti dat.
Datoví inženýři používají službu Azure Data Factory k vytváření řešení extrakce, transformace a načítání (ETL), která naplňují analytická úložiště dat dat dat z transakčních systémů v celé organizaci.
Microsoft Fabric
Microsoft Fabric je jednotná analytická platforma SaaS (Software as a Service) založená na otevřeném a řízeném lakehouse, která zahrnuje funkce pro podporu:
- Příjem dat a ETL
- Analýza Data Lakehouse
- Analýza datového skladu
- Datová Věda a strojové učení
- Analýza v reálném čase
- Vizualizace dat
- Zásady správného řízení a správa dat
- Přehledy založené na umělé inteligenci
Datoví inženýři můžou pomocí Microsoft Fabric vytvořit jednotné řešení analýzy dat, které kombinuje kanály příjmu dat, datové sklady, analýzy v reálném čase, business intelligence a přehledy využívající umělou inteligenci prostřednictvím jediné služby, která je centrálně uložená s Microsoft OneLake.
Azure Databricks
Azure Databricks je integrovaná verze Azure oblíbené platformy Databricks, která kombinuje platformu pro zpracování dat Apache Sparku s sémantikou databáze SQL a integrovaným rozhraním pro správu, které umožňuje rozsáhlé analýzy dat.
Datoví inženýři můžou k vytváření analytických úložišť dat v Azure Databricks používat stávající dovednosti Databricks a Spark.
Datoví analytici můžou používat nativní podporu poznámkových bloků v Azure Databricks k dotazování a vizualizaci dat v snadno použitelném webovém rozhraní.
Azure Stream Analytics
Azure Stream Analytics je modul pro zpracování datových proudů v reálném čase, který zachycuje datový proud ze vstupu, používá dotaz k extrakci a manipulaci s daty ze vstupního datového proudu a zapisuje výsledky do výstupu pro účely analýzy nebo dalšího zpracování.
Datoví inženýři můžou začlenit Azure Stream Analytics do architektur analýzy dat, které zaznamenávají streamovaná data pro příjem dat do analytického úložiště dat nebo pro vizualizaci v reálném čase.
Průzkumník dat Azure
Azure Data Explorer je plně spravovaná samostatná analytická platforma pro velké objemy dat, která nabízí vysoce výkonné dotazování na data protokolů a telemetrie.
Datoví analytici můžou pomocí Azure Data Exploreru dotazovat a analyzovat data, která obsahují atribut časového razítka, například se obvykle nacházejí v souborech protokolů a telemetrických datech IoT (Internet of-things ).
Microsoft Purview
Microsoft Purview poskytuje řešení pro zásady správného řízení a zjistitelnost dat na podnikové úrovni. Microsoft Purview můžete použít k vytvoření mapy dat a sledování rodokmenu dat napříč několika zdroji dat a systémy, což vám umožní najít důvěryhodná data pro analýzu a vytváření sestav.
Datoví inženýři můžou pomocí Microsoft Purview vynutit zásady správného řízení dat v celém podniku a zajistit integritu dat, která se používají k podpoře analytických úloh.