Jak działa usługa Azure Synapse Analytics

Ukończone

Aby zapewnić obsługę potrzeb analitycznych współczesnych organizacji, usługa Azure Synapse Analytics łączy scentralizowaną usługę do przechowywania i przetwarzania danych z rozszerzalną architekturą, za pomocą której połączone usługi umożliwiają integrację często używanych magazynów danych, platform przetwarzania i narzędzi do wizualizacji.

Tworzenie i używanie obszaru roboczego usługi Azure Synapse Analytics

Obszar roboczy usługi Synapse Analytics definiuje wystąpienie usługi Synapse Analytics, w którym można zarządzać usługami i zasobami danych potrzebnymi do rozwiązania analitycznego. Obszar roboczy usługi Synapse Analytics można utworzyć interaktywnie w ramach subskrypcji platformy Azure przy użyciu witryny Azure Portal lub zautomatyzować wdrażanie przy użyciu programu Azure PowerShell, interfejsu wiersza polecenia platformy Azure lub szablonu usługi Azure Resource Manager lub Bicep.

Po utworzeniu obszaru roboczego usługi Synapse Analytics możesz zarządzać w nim usługami i wykonywać z nimi zadania analizy danych przy użyciu programu Synapse Studio— portalu internetowego dla usługi Azure Synapse Analytics.

Zrzut ekranu przedstawiający program Azure Synapse Studio.

Praca z plikami w usłudze Data Lake

Jednym z podstawowych zasobów w obszarze roboczym usługi Synapse Analytics jest magazyn typu data lake, w którym pliki danych mogą być przechowywane i przetwarzane na dużą skalę. Obszar roboczy zazwyczaj ma domyślne magazyny data lake, które jest implementowane jako połączona usługa z kontenerem usługi Azure Data Lake Storage Gen2. Możesz dodać połączone usługi dla wielu magazynów data lake, które są oparte na różnych platformach magazynowania zgodnie z potrzebami.

Zrzut ekranu przedstawiający połączoną usługę data lake w programie Azure Studio.

Pozyskiwanie i przekształcanie danych za pomocą potoków

W większości rozwiązań do analizy danych przedsiębiorstwa dane są wyodrębniane z wielu źródeł operacyjnych i przesyłane do centralnego magazynu danych lub magazynu danych do analizy. Usługa Azure Synapse Analytics obejmuje wbudowaną obsługę tworzenia, uruchamiania i zarządzania potokami, które organizują działania niezbędne do pobierania danych z różnych źródeł, przekształcania danych zgodnie z potrzebami i ładowania wynikowych przekształconych danych do magazynu analitycznego.

Zrzut ekranu przedstawiający potok w programie Azure Synapse Studio.

Uwaga

Potoki w usłudze Azure Synapse Analytics są oparte na tej samej technologii podstawowej co usługa Azure Data Factory. Jeśli znasz już usługę Azure Data Factory, możesz wykorzystać istniejące umiejętności w celu tworzenia rozwiązań do pozyskiwania i przekształcania danych w usłudze Azure Synapse Analytics.

Wykonywanie zapytań dotyczących danych i manipulowanie nimi za pomocą języka SQL

Structured Query Language (SQL) to wszechobecny język do wykonywania zapytań i manipulowania danymi oraz jest podstawą relacyjnych baz danych, w tym popularnej platformy bazy danych programu Microsoft SQL Server. Usługa Azure Synapse Analytics obsługuje wykonywanie zapytań i manipulowanie danymi opartymi na języku SQL za pośrednictwem dwóch rodzajów puli SQL opartej na akiecie relacyjnej bazy danych programu SQL Server:

  • Wbudowana bezserwerowa pula zoptymalizowana pod kątem używania semantyki relacyjnej bazy danych SQL do wykonywania zapytań dotyczących danych opartych na plikach w usłudze Data Lake.
  • Niestandardowe dedykowane pule SQL hostujące magazyny danych relacyjnych.

System Azure Synapse SQL używa rozproszonego modelu przetwarzania zapytań do równoległości operacji SQL, co powoduje wysoce skalowalne rozwiązanie do przetwarzania danych relacyjnych. Możesz użyć wbudowanej puli bezserwerowej na potrzeby ekonomicznej analizy i przetwarzania danych plików w usłudze Data Lake oraz użyć dedykowanych pul SQL do tworzenia relacyjnych magazynów danych na potrzeby modelowania i raportowania danych przedsiębiorstwa.

Zrzut ekranu przedstawiający zapytanie SQL i bazy danych w usłudze Azure Synapse Studio.

Przetwarzanie i analizowanie danych za pomocą platformy Apache Spark

Apache Spark to platforma typu open source do analizy danych big data. Platforma Spark wykonuje rozproszone przetwarzanie plików w usłudze Data Lake, uruchamiając zadania, które można zaimplementować przy użyciu dowolnego z wielu obsługiwanych języków programowania. Języki obsługiwane na platformie Spark obejmują języki Python, Scala, Java, SQL i C#.

W usłudze Azure Synapse Analytics można utworzyć co najmniej jedną pulę platformy Spark i używać notesów interaktywnych do łączenia kodu i notatek podczas tworzenia rozwiązań do analizy danych, uczenia maszynowego i wizualizacji danych.

Zrzut ekranu przedstawiający notes platformy Spark w usłudze Azure Synapse Studio.

Eksplorowanie danych za pomocą Eksploratora danych

Azure Synapse Data Explorer to aparat przetwarzania danych w usłudze Azure Synapse Analytics oparty na usłudze Azure Data Explorer. Eksplorator danych używa intuicyjnej składni zapytań o nazwie język zapytań Kusto (KQL), aby umożliwić wysoką wydajność, analizę danych wsadowych i przesyłanych strumieniowo.

Zrzut ekranu przedstawiający skrypt język zapytań Kusto w usłudze Azure Synapse Studio.

Integracja z innymi usługami danych platformy Azure

Usługę Azure Synapse Analytics można zintegrować z innymi usługami danych platformy Azure na potrzeby kompleksowej analizy. Zintegrowane rozwiązania obejmują:

  • Usługa Azure Synapse Link umożliwia synchronizację niemal w czasie rzeczywistym między danymi operacyjnymi w usługach Azure Cosmos DB, Azure SQL Database, SQL Server i Microsoft Power Platform Dataverse oraz analitycznym magazynie danych, które można wykonywać w usłudze Azure Synapse Analytics.
  • Integracja z usługą Microsoft Power BI umożliwia analitykom danych integrację obszaru roboczego usługi Power BI z obszarem roboczym usługi Synapse i wykonywanie interaktywnej wizualizacji danych w usłudze Azure Synapse Studio.
  • Integracja usługi Microsoft Purview umożliwia organizacjom katalogowanie zasobów danych w usłudze Azure Synapse Analytics i ułatwia inżynierom danych znajdowanie zasobów danych i śledzenie pochodzenia danych podczas implementowania potoków danych, które pozyskują dane w usłudze Azure Synapse Analytics.
  • Integracja usługi Azure Machine Learning umożliwia analitykom danych i analitykom danych integrację trenowania i użycia modelu predykcyjnego z rozwiązaniami analitycznymi.