Omówienie możliwości bezserwerowej puli SQL usługi Azure Synapse i przypadków użycia

5 min

Azure Synapse Analytics to zintegrowana usługa analityczna, która łączy szeroką gamę powszechnie używanych technologii przetwarzania i analizowania danych na dużą skalę. Jedną z najbardziej najpopularniejszych technologii używanych w rozwiązaniach danych jest SQL — standardowy język branżowy służący do wykonywania zapytań i manipulowania danymi.

Bezserwerowe pule SQL w usłudze Azure Synapse Analytics

Usługa Azure Synapse SQL to rozproszony system zapytań w usłudze Azure Synapse Analytics, który oferuje dwa rodzaje środowisk uruchomieniowych:

Bezserwerowa pula SQL: przetwarzanie zapytań SQL na żądanie, używane głównie do pracy z danymi w usłudze Data Lake.
Dedykowana pula SQL: wystąpienia relacyjnej bazy danych w skali przedsiębiorstwa używane do hostowania magazynów danych, w których dane są przechowywane w tabelach relacyjnych.

W tym module skoncentrujemy się na bezserwerowej puli SQL, która zapewnia punkt końcowy płatności za zapytanie w celu wykonywania zapytań dotyczących danych w usłudze Data Lake. Zalety korzystania z bezserwerowej puli SQL obejmują:

Znana składnia języka Transact-SQL umożliwiająca wykonywanie zapytań dotyczących danych bez konieczności kopiowania lub ładowania danych do wyspecjalizowanego magazynu.
Zintegrowana łączność z szeroką gamą narzędzi do analizy biznesowej i narzędzi do wykonywania zapytań ad hoc, w tym najpopularniejszych sterowników.
Przetwarzanie zapytań rozproszonych, które jest tworzone na potrzeby danych na dużą skalę i funkcji obliczeniowych , co skutkuje szybką wydajnością zapytań.
Wbudowana odporność na uszkodzenia wykonywania zapytań, co skutkuje wysoką niezawodnością i współczynnikami powodzenia nawet w przypadku długotrwałych zapytań obejmujących duże zestawy danych.
Brak infrastruktury do skonfigurowania ani obsługi klastrów. Wbudowany punkt końcowy dla tej usługi jest udostępniany w każdym obszarze roboczym usługi Azure Synapse, dzięki czemu można rozpocząć wykonywanie zapytań o dane zaraz po utworzeniu obszaru roboczego.
Opłaty za zasoby zarezerwowane są naliczane tylko za dane przetwarzane przez uruchomione zapytania.

Kiedy używać bezserwerowych pul SQL

Bezserwerowa pula SQL jest dostosowana do wykonywania zapytań dotyczących danych znajdujących się w usłudze Data Lake, więc oprócz wyeliminowania obciążeń związanych z zarządzaniem eliminuje konieczność pozyskiwania danych do systemu. Wystarczy wskazać zapytanie do danych, które są już w magazynie typu lake, i uruchomić je.

Model zasobów bezserwerowych usługi Synapse SQL doskonale nadaje się do nieplanowanych lub "pęknięć" obciążeń, które mogą być przetwarzane przy użyciu zawsze włączonego bezserwerowego punktu końcowego SQL w obszarze roboczym usługi Azure Synapse Analytics. Korzystanie z puli bezserwerowej pomaga w przypadku konieczności znajomości dokładnego kosztu dla każdego zapytania wykonanego w celu monitorowania kosztów i atrybutów.

Uwaga

Bezserwerowa pula SQL jest systemem analitycznym i nie jest zalecana w przypadku obciążeń OLTP, takich jak bazy danych używane przez aplikacje do przechowywania danych transakcyjnych. Obciążenia, które wymagają milisekundowych czasów odpowiedzi i chcą wskazać pojedynczy wiersz w zestawie danych, nie są odpowiednie dla bezserwerowej puli SQL.

Typowe przypadki użycia bezserwerowych pul SQL obejmują:

Eksploracja danych: eksploracja danych obejmuje przeglądanie usługi Data Lake w celu uzyskania początkowych szczegółowych informacji o danych i jest łatwo osiągalne w usłudze Azure Synapse Studio. Możesz przeglądać pliki w połączonym magazynie data lake i użyć wbudowanej bezserwerowej puli SQL, aby automatycznie wygenerować skrypt SQL, aby wybrać 100 pierwszych wierszy z pliku lub folderu tak samo jak w przypadku tabeli w programie SQL Server. Z tego miejsca można stosować projekcje, filtrowanie, grupowanie i większość operacji na danych tak, jakby dane znajdowały się w regularnej tabeli programu SQL Server.
Przekształcanie danych: Chociaż usługa Azure Synapse Analytics zapewnia doskonałe możliwości przekształcania danych za pomocą usługi Synapse Spark, niektórzy inżynierowie danych mogą łatwiej znaleźć transformację danych w celu osiągnięcia przy użyciu języka SQL. Bezserwerowa pula SQL umożliwia wykonywanie przekształceń danych opartych na języku SQL; interaktywnie lub jako część zautomatyzowanego potoku danych.
Logiczny magazyn danych: po początkowej eksploracji danych w usłudze Data Lake można zdefiniować obiekty zewnętrzne, takie jak tabele i widoki w bezserwerowej bazie danych SQL. Dane pozostają przechowywane w plikach data lake, ale są abstrakcyjne przez schemat relacyjny, który może być używany przez aplikacje klienckie i narzędzia analityczne do wykonywania zapytań o dane, tak jak w relacyjnej bazie danych hostowanej w programie SQL Server.

Omówienie możliwości bezserwerowej puli SQL usługi Azure Synapse i przypadków użycia

Bezserwerowe pule SQL w usłudze Azure Synapse Analytics

Kiedy używać bezserwerowych pul SQL

Opinia