Så här fungerar Azure Synapse Analytics

Slutförd

För att stödja dagens organisationers analysbehov kombinerar Azure Synapse Analytics en centraliserad tjänst för datalagring och bearbetning med en utökningsbar arkitektur genom vilken länkade tjänster gör att du kan integrera vanliga datalager, bearbetningsplattformar och visualiseringsverktyg.

Skapa och använda en Azure Synapse Analytics-arbetsyta

En Synapse Analytics-arbetsyta definierar en instans av Synapse Analytics-tjänsten där du kan hantera de tjänster och dataresurser som behövs för din analyslösning. Du kan skapa en Synapse Analytics-arbetsyta i en Azure-prenumeration interaktivt med hjälp av Azure Portal, eller så kan du automatisera distributionen med hjälp av Azure PowerShell, Azures kommandoradsgränssnitt (CLI) eller med en Azure Resource Manager- eller Bicep-mall.

När du har skapat en Synapse Analytics-arbetsyta kan du hantera tjänsterna i den och utföra dataanalysuppgifter med dem med hjälp av Synapse Studio, en webbaserad portal för Azure Synapse Analytics.

Skärmbild av Azure Synapse Studio.

Arbeta med filer i en datasjö

En av kärnresurserna i en Synapse Analytics-arbetsyta är en datasjö där datafiler kan lagras och bearbetas i stor skala. En arbetsyta har vanligtvis en standarddatasjö, som implementeras som en länkad tjänst till en Azure Data Lake Storage Gen2-container. Du kan lägga till länkade tjänster för flera datasjöar som baseras på olika lagringsplattformar efter behov.

Skärmbild av en länkad datasjötjänst i Azure Studio.

Mata in och transformera data med pipelines

I de flesta lösningar för företagsdataanalys extraheras data från flera driftkällor och överförs till en central datasjö eller ett informationslager för analys. Azure Synapse Analytics innehåller inbyggt stöd för att skapa, köra och hantera pipelines som samordnar de aktiviteter som krävs för att hämta data från en rad olika källor, transformera data efter behov och läsa in resulterande transformerade data till ett analysarkiv.

Skärmbild av en pipeline i Azure Synapse Studio.

Kommentar

Pipelines i Azure Synapse Analytics baseras på samma underliggande teknik som Azure Data Factory. Om du redan är bekant med Azure Data Factory kan du använda dina befintliga kunskaper för att skapa datainmatnings- och transformeringslösningar i Azure Synapse Analytics.

Köra frågor mot och manipulera data med SQL

Structured Query Language (SQL) är ett allmänt språk för att fråga efter och manipulera data och är grunden för relationsdatabaser, inklusive den populära Microsoft SQL Server-databasplattformen. Azure Synapse Analytics stöder SQL-baserad datafrågor och manipulering via två typer av SQL-pooler som baseras på SQL Server-relationsdatabasmotorn:

  • En inbyggd serverlös pool som är optimerad för att använda relationsbaserad SQL-semantik för att fråga efter filbaserade data i en datasjö.
  • Anpassade dedikerade SQL-pooler som är värdar för relationsdatalager.

Azure Synapse SQL-systemet använder en distribuerad frågebearbetningsmodell för att parallellisera SQL-åtgärder, vilket resulterar i en mycket skalbar lösning för bearbetning av relationsdata. Du kan använda den inbyggda serverlösa poolen för kostnadseffektiv analys och bearbetning av fildata i datasjön och använda dedikerade SQL-pooler för att skapa relationsdatalager för modellering och rapportering av företagsdata.

Skärmbild av en SQL-fråga och databaser i Azure Synapse Studio.

Bearbeta och analysera data med Apache Spark

Apache Spark är en öppen källkod plattform för stordataanalys. Spark utför distribuerad bearbetning av filer i en datasjö genom att köra jobb som kan implementeras med någon av de olika programmeringsspråk som stöds. Språk som stöds i Spark är Python, Scala, Java, SQL och C#.

I Azure Synapse Analytics kan du skapa en eller flera Spark-pooler och använda interaktiva notebook-filer för att kombinera kod och anteckningar när du skapar lösningar för dataanalys, maskininlärning och datavisualisering.

Skärmbild av en Spark-anteckningsbok i Azure Synapse Studio.

Utforska data med Data Explorer

Azure Synapse Data Explorer är en databearbetningsmotor i Azure Synapse Analytics som baseras på Azure Data Explorer-tjänsten. DataUtforskaren använder en intuitiv frågesyntax med namnet Kusto-frågespråk (KQL) för att möjliggöra analys med höga prestanda, korta svarstider för batchdata och strömmande data.

Skärmbild av ett Kusto-frågespråk skript i Azure Synapse Studio.

Integrera med andra Azure-datatjänster

Azure Synapse Analytics kan integreras med andra Azure-datatjänster för analyslösningar från slutpunkt till slutpunkt. Integrerade lösningar omfattar:

  • Azure Synapse Link möjliggör nästan realtidssynkronisering mellan driftdata i Azure Cosmos DB, Azure SQL Database, SQL Server och Microsoft Power Platform Dataverse och analysdatalagring som kan efterfrågas i Azure Synapse Analytics.
  • Med Microsoft Power BI-integrering kan dataanalytiker integrera en Power BI-arbetsyta i en Synapse-arbetsyta och utföra interaktiv datavisualisering i Azure Synapse Studio.
  • Med Microsoft Purview-integrering kan organisationer katalogisera datatillgångar i Azure Synapse Analytics och göra det enklare för datatekniker att hitta datatillgångar och spåra dataursprung när de implementerar datapipelines som matar in data i Azure Synapse Analytics.
  • Azure Machine Learning-integrering gör det möjligt för dataanalytiker och dataforskare att integrera förutsägelsemodellträning och -förbrukning i analytiska lösningar.