Jak funguje Azure Synapse Analytics
Pro podporu analytických potřeb dnešních organizací služba Azure Synapse Analytics kombinuje centralizovanou službu pro ukládání a zpracování dat s rozšiřitelnou architekturou, prostřednictvím které propojené služby umožňují integrovat běžně používané úložiště dat, platformy zpracování a nástroje pro vizualizaci.
Vytvoření a používání pracovního prostoru Azure Synapse Analytics
Pracovní prostor Synapse Analytics definuje instanci služby Synapse Analytics, ve které můžete spravovat služby a datové prostředky potřebné pro vaše analytické řešení. Pracovní prostor Synapse Analytics můžete v předplatném Azure interaktivně vytvořit pomocí webu Azure Portal nebo můžete automatizovat nasazení pomocí Azure PowerShellu, rozhraní příkazového řádku Azure (CLI) nebo šablony Azure Resource Manageru nebo Bicep.
Po vytvoření pracovního prostoru Synapse Analytics můžete spravovat služby v něm a provádět s nimi úlohy analýzy dat pomocí nástroje Synapse Studio– webového portálu pro Azure Synapse Analytics.
Práce se soubory v datovém jezeře
Jedním ze základních prostředků v pracovním prostoru Synapse Analytics je datové jezero, ve kterém je možné datové soubory ukládat a zpracovávat ve velkém měřítku. Pracovní prostor má obvykle výchozí datové jezero, které se implementuje jako propojená služba s kontejnerem Azure Data Lake Storage Gen2. Podle potřeby můžete přidat propojené služby pro více datových jezer, která jsou založená na různých úložných platformách.
Ingestování a transformace dat pomocí kanálů
Ve většině podnikových řešení pro analýzu dat se data extrahují z několika provozních zdrojů a přenášejí se do centrálního datového jezera nebo datového skladu pro účely analýzy. Azure Synapse Analytics zahrnuje integrovanou podporu pro vytváření, spouštění a správu kanálů , které orchestrují aktivity potřebné k načtení dat z celé řady zdrojů, transformaci dat podle potřeby a načtení výsledných transformovaných dat do analytického úložiště.
Poznámka:
Kanály ve službě Azure Synapse Analytics jsou založené na stejné základní technologii jako Azure Data Factory. Pokud už službu Azure Data Factory znáte, můžete využít své stávající dovednosti k vytváření řešení pro příjem a transformaci dat ve službě Azure Synapse Analytics.
Dotazování a manipulace s daty pomocí SQL
jazyk SQL (Structured Query Language) (SQL) je všudypřítomný jazyk pro dotazování a manipulaci s daty a je základem relačních databází, včetně oblíbené databázové platformy Microsoft SQL Serveru. Azure Synapse Analytics podporuje dotazování a manipulaci s daty založenými na SQL Serveru prostřednictvím dvou druhů fondu SQL založených na relačním databázovém stroji SQL Serveru:
- Integrovaný bezserverový fond, který je optimalizovaný pro použití relační sémantiky SQL k dotazování na data založená na souborech v datovém jezeře.
- Vlastní vyhrazené fondy SQL, které hostují relační datové sklady.
Systém Azure Synapse SQL používá k paralelizaci operací SQL model distribuovaného zpracování dotazů, což vede k vysoce škálovatelnému řešení pro zpracování relačních dat. Integrovaný bezserverový fond můžete použít k nákladově efektivní analýze a zpracování dat souborů v datovém jezeře a použití vyhrazených fondů SQL k vytvoření relačních datových skladů pro modelování a vytváření sestav podnikových dat.
Zpracování a analýza dat pomocí Apache Sparku
Apache Spark je opensourcová platforma pro analýzu velkých objemů dat. Spark provádí distribuované zpracování souborů v datovém jezeře spouštěním úloh, které je možné implementovat pomocí libovolného rozsahu podporovaných programovacích jazyků. Mezi jazyky podporované ve Sparku patří Python, Scala, Java, SQL a C#.
V Azure Synapse Analytics můžete vytvořit jeden nebo více fondů Sparku a pomocí interaktivních poznámkových bloků kombinovat kód a poznámky při vytváření řešení pro analýzu dat, strojové učení a vizualizaci dat.
Zkoumání dat pomocí Průzkumníka dat
Azure Synapse Data Explorer je modul pro zpracování dat v Azure Synapse Analytics, který je založený na službě Azure Data Explorer. Průzkumník dat používá intuitivní syntaxi dotazů s názvem dotazovací jazyk Kusto (KQL), která umožňuje vysokou výkonnou analýzu dávkových a streamovaných dat s nízkou latencí.
Integrace s dalšími datovými službami Azure
Azure Synapse Analytics je možné integrovat s dalšími datovými službami Azure pro komplexní analytická řešení. Integrovaná řešení zahrnují:
- Azure Synapse Link umožňuje téměř v reálném čase synchronizovat provozní data ve službě Azure Cosmos DB, Azure SQL Database, SQL Server a Microsoft Power Platform Dataverse a analytické úložiště dat, které je možné dotazovat ve službě Azure Synapse Analytics.
- Integrace Microsoft Power BI umožňuje datovým analytikům integrovat pracovní prostor Power BI do pracovního prostoru Synapse a provádět interaktivní vizualizaci dat v Azure Synapse Studiu.
- Integrace Microsoft Purview umožňuje organizacím katalogovat datové prostředky ve službě Azure Synapse Analytics a usnadňuje datovým inženýrům hledání datových prostředků a sledování rodokmenu dat při implementaci datových kanálů, které ingestují data do Azure Synapse Analytics.
- Integrace služby Azure Machine Learning umožňuje datovým analytikům a datovým vědcům integrovat prediktivní trénování a spotřebu modelů do analytických řešení.