Omówienie możliwości bezserwerowej puli SQL usługi Azure Synapse i przypadków użycia

Ukończone

Azure Synapse Analytics to zintegrowana usługa analityczna, która łączy szeroką gamę powszechnie używanych technologii przetwarzania i analizowania danych na dużą skalę. Jedną z najbardziej najpopularniejszych technologii używanych w rozwiązaniach danych jest SQL — standardowy język branżowy służący do wykonywania zapytań i manipulowania danymi.

Bezserwerowe pule SQL w usłudze Azure Synapse Analytics

Usługa Azure Synapse SQL to rozproszony system zapytań w usłudze Azure Synapse Analytics, który oferuje dwa rodzaje środowisk uruchomieniowych:

  • Bezserwerowa pula SQL: przetwarzanie zapytań SQL na żądanie, używane głównie do pracy z danymi w usłudze Data Lake.
  • Dedykowana pula SQL: wystąpienia relacyjnej bazy danych w skali przedsiębiorstwa używane do hostowania magazynów danych, w których dane są przechowywane w tabelach relacyjnych.

W tym module skoncentrujemy się na bezserwerowej puli SQL, która zapewnia punkt końcowy płatności za zapytanie w celu wykonywania zapytań dotyczących danych w usłudze Data Lake. Zalety korzystania z bezserwerowej puli SQL obejmują:

  • Znana składnia języka Transact-SQL umożliwiająca wykonywanie zapytań dotyczących danych bez konieczności kopiowania lub ładowania danych do wyspecjalizowanego magazynu.
  • Zintegrowana łączność z szeroką gamą narzędzi do analizy biznesowej i narzędzi do wykonywania zapytań ad hoc, w tym najpopularniejszych sterowników.
  • Przetwarzanie zapytań rozproszonych, które jest tworzone na potrzeby danych na dużą skalę i funkcji obliczeniowych , co skutkuje szybką wydajnością zapytań.
  • Wbudowana odporność na uszkodzenia wykonywania zapytań, co skutkuje wysoką niezawodnością i współczynnikami powodzenia nawet w przypadku długotrwałych zapytań obejmujących duże zestawy danych.
  • Brak infrastruktury do skonfigurowania ani obsługi klastrów. Wbudowany punkt końcowy dla tej usługi jest udostępniany w każdym obszarze roboczym usługi Azure Synapse, dzięki czemu można rozpocząć wykonywanie zapytań o dane zaraz po utworzeniu obszaru roboczego.
  • Opłaty za zasoby zarezerwowane są naliczane tylko za dane przetwarzane przez uruchomione zapytania.

Kiedy używać bezserwerowych pul SQL

Bezserwerowa pula SQL jest dostosowana do wykonywania zapytań dotyczących danych znajdujących się w usłudze Data Lake, więc oprócz wyeliminowania obciążeń związanych z zarządzaniem eliminuje konieczność pozyskiwania danych do systemu. Wystarczy wskazać zapytanie do danych, które są już w magazynie typu lake, i uruchomić je.

Model zasobów bezserwerowych usługi Synapse SQL doskonale nadaje się do nieplanowanych lub "pęknięć" obciążeń, które mogą być przetwarzane przy użyciu zawsze włączonego bezserwerowego punktu końcowego SQL w obszarze roboczym usługi Azure Synapse Analytics. Korzystanie z puli bezserwerowej pomaga w przypadku konieczności znajomości dokładnego kosztu dla każdego zapytania wykonanego w celu monitorowania kosztów i atrybutów.

Uwaga

Bezserwerowa pula SQL jest systemem analitycznym i nie jest zalecana w przypadku obciążeń OLTP, takich jak bazy danych używane przez aplikacje do przechowywania danych transakcyjnych. Obciążenia, które wymagają milisekundowych czasów odpowiedzi i chcą wskazać pojedynczy wiersz w zestawie danych, nie są odpowiednie dla bezserwerowej puli SQL.

Typowe przypadki użycia bezserwerowych pul SQL obejmują:

  • Eksploracja danych: eksploracja danych obejmuje przeglądanie usługi Data Lake w celu uzyskania początkowych szczegółowych informacji o danych i jest łatwo osiągalne w usłudze Azure Synapse Studio. Możesz przeglądać pliki w połączonym magazynie data lake i użyć wbudowanej bezserwerowej puli SQL, aby automatycznie wygenerować skrypt SQL, aby wybrać 100 pierwszych wierszy z pliku lub folderu tak samo jak w przypadku tabeli w programie SQL Server. Z tego miejsca można stosować projekcje, filtrowanie, grupowanie i większość operacji na danych tak, jakby dane znajdowały się w regularnej tabeli programu SQL Server.
  • Przekształcanie danych: Chociaż usługa Azure Synapse Analytics zapewnia doskonałe możliwości przekształcania danych za pomocą usługi Synapse Spark, niektórzy inżynierowie danych mogą łatwiej znaleźć transformację danych w celu osiągnięcia przy użyciu języka SQL. Bezserwerowa pula SQL umożliwia wykonywanie przekształceń danych opartych na języku SQL; interaktywnie lub jako część zautomatyzowanego potoku danych.
  • Logiczny magazyn danych: po początkowej eksploracji danych w usłudze Data Lake można zdefiniować obiekty zewnętrzne, takie jak tabele i widoki w bezserwerowej bazie danych SQL. Dane pozostają przechowywane w plikach data lake, ale są abstrakcyjne przez schemat relacyjny, który może być używany przez aplikacje klienckie i narzędzia analityczne do wykonywania zapytań o dane, tak jak w relacyjnej bazie danych hostowanej w programie SQL Server.