Omówienie możliwości bezserwerowej puli SQL usługi Azure Synapse i przypadków użycia
Azure Synapse Analytics to zintegrowana usługa analityczna, która łączy szeroką gamę powszechnie używanych technologii przetwarzania i analizowania danych na dużą skalę. Jedną z najbardziej najpopularniejszych technologii używanych w rozwiązaniach danych jest SQL — standardowy język branżowy służący do wykonywania zapytań i manipulowania danymi.
Bezserwerowe pule SQL w usłudze Azure Synapse Analytics
Usługa Azure Synapse SQL to rozproszony system zapytań w usłudze Azure Synapse Analytics, który oferuje dwa rodzaje środowisk uruchomieniowych:
- Bezserwerowa pula SQL: przetwarzanie zapytań SQL na żądanie, używane głównie do pracy z danymi w usłudze Data Lake.
- Dedykowana pula SQL: wystąpienia relacyjnej bazy danych w skali przedsiębiorstwa używane do hostowania magazynów danych, w których dane są przechowywane w tabelach relacyjnych.
W tym module skoncentrujemy się na bezserwerowej puli SQL, która zapewnia punkt końcowy płatności za zapytanie w celu wykonywania zapytań dotyczących danych w usłudze Data Lake. Zalety korzystania z bezserwerowej puli SQL obejmują:
- Znana składnia języka Transact-SQL umożliwiająca wykonywanie zapytań dotyczących danych bez konieczności kopiowania lub ładowania danych do wyspecjalizowanego magazynu.
- Zintegrowana łączność z szeroką gamą narzędzi do analizy biznesowej i narzędzi do wykonywania zapytań ad hoc, w tym najpopularniejszych sterowników.
- Przetwarzanie zapytań rozproszonych, które jest tworzone na potrzeby danych na dużą skalę i funkcji obliczeniowych , co skutkuje szybką wydajnością zapytań.
- Wbudowana odporność na uszkodzenia wykonywania zapytań, co skutkuje wysoką niezawodnością i współczynnikami powodzenia nawet w przypadku długotrwałych zapytań obejmujących duże zestawy danych.
- Brak infrastruktury do skonfigurowania ani obsługi klastrów. Wbudowany punkt końcowy dla tej usługi jest udostępniany w każdym obszarze roboczym usługi Azure Synapse, dzięki czemu można rozpocząć wykonywanie zapytań o dane zaraz po utworzeniu obszaru roboczego.
- Opłaty za zasoby zarezerwowane są naliczane tylko za dane przetwarzane przez uruchomione zapytania.
Kiedy używać bezserwerowych pul SQL
Bezserwerowa pula SQL jest dostosowana do wykonywania zapytań dotyczących danych znajdujących się w usłudze Data Lake, więc oprócz wyeliminowania obciążeń związanych z zarządzaniem eliminuje konieczność pozyskiwania danych do systemu. Wystarczy wskazać zapytanie do danych, które są już w magazynie typu lake, i uruchomić je.
Model zasobów bezserwerowych usługi Synapse SQL doskonale nadaje się do nieplanowanych lub "pęknięć" obciążeń, które mogą być przetwarzane przy użyciu zawsze włączonego bezserwerowego punktu końcowego SQL w obszarze roboczym usługi Azure Synapse Analytics. Korzystanie z puli bezserwerowej pomaga w przypadku konieczności znajomości dokładnego kosztu dla każdego zapytania wykonanego w celu monitorowania kosztów i atrybutów.
Uwaga
Bezserwerowa pula SQL jest systemem analitycznym i nie jest zalecana w przypadku obciążeń OLTP, takich jak bazy danych używane przez aplikacje do przechowywania danych transakcyjnych. Obciążenia, które wymagają milisekundowych czasów odpowiedzi i chcą wskazać pojedynczy wiersz w zestawie danych, nie są odpowiednie dla bezserwerowej puli SQL.
Typowe przypadki użycia bezserwerowych pul SQL obejmują:
- Eksploracja danych: eksploracja danych obejmuje przeglądanie usługi Data Lake w celu uzyskania początkowych szczegółowych informacji o danych i jest łatwo osiągalne w usłudze Azure Synapse Studio. Możesz przeglądać pliki w połączonym magazynie data lake i użyć wbudowanej bezserwerowej puli SQL, aby automatycznie wygenerować skrypt SQL, aby wybrać 100 pierwszych wierszy z pliku lub folderu tak samo jak w przypadku tabeli w programie SQL Server. Z tego miejsca można stosować projekcje, filtrowanie, grupowanie i większość operacji na danych tak, jakby dane znajdowały się w regularnej tabeli programu SQL Server.
- Przekształcanie danych: Chociaż usługa Azure Synapse Analytics zapewnia doskonałe możliwości przekształcania danych za pomocą usługi Synapse Spark, niektórzy inżynierowie danych mogą łatwiej znaleźć transformację danych w celu osiągnięcia przy użyciu języka SQL. Bezserwerowa pula SQL umożliwia wykonywanie przekształceń danych opartych na języku SQL; interaktywnie lub jako część zautomatyzowanego potoku danych.
- Logiczny magazyn danych: po początkowej eksploracji danych w usłudze Data Lake można zdefiniować obiekty zewnętrzne, takie jak tabele i widoki w bezserwerowej bazie danych SQL. Dane pozostają przechowywane w plikach data lake, ale są abstrakcyjne przez schemat relacyjny, który może być używany przez aplikacje klienckie i narzędzia analityczne do wykonywania zapytań o dane, tak jak w relacyjnej bazie danych hostowanej w programie SQL Server.