Typy usługi SQL Warehouse

Artykuł
01/23/2025

Usługa Databricks SQL obsługuje typy bezserwerowe, pro i klasyczne. W tym artykule opisano funkcje dostępne dla każdego typu i porównują wydajność i funkcje.

Możliwości wydajności według typu

Każdy typ usługi SQL Warehouse ma różne możliwości wydajności. W poniższej tabeli przedstawiono funkcje wydajności obsługiwane przez każdy typ magazynu SQL.

Typ magazynu	Aparat fotonów	Predykcyjne wejście/wyjście	Inteligentne zarządzanie obciążeniami
Bezserwerowy	X	X	X
Pro	X	X
Klasyczny	X

Poniższa lista zawiera opis każdej funkcji wydajności:

Photon: wbudowany wektoryzowany aparat zapytań w usłudze Databricks. Dzięki temu istniejące wywołania interfejsu API SQL i DataFrame stają się szybsze i zmniejsza całkowity koszt na każdą jednostkę pracy.
Predictive IO: pakiet funkcji przyspieszających operacje skanowania selektywnego w zapytaniach SQL. Predykcyjne we/wy może zapewnić szeroką gamę przyspieszeń.
inteligentne zarządzanie obciążeniami (IWM): zestaw funkcji, które zwiększają zdolność usługi Databricks SQL Serverless do szybkiego i efektywnego kosztowo przetwarzania dużej liczby zapytań. Korzystając z technik przewidywania opartego na sztucznej inteligencji i dynamicznego zarządzania, IWM działa w celu sprawdzenia, czy obciążenia mają odpowiednią ilość zasobów. Kluczową różnicą są możliwości sztucznej inteligencji w usłudze Databricks SQL w celu dynamicznego reagowania na wymagania dotyczące obciążeń, a nie używania progów statycznych.

Notatka

Aby uzyskać cennik dla każdego typu magazynu i szczegółowe porównanie funkcji, zobacz Databricks SQL. Aby dowiedzieć się więcej o najnowszych funkcjach sql usługi Databricks, zobacz Informacje o wersji sql usługi Databricks.

Różnice wydajności między typami usługi SQL Warehouse

Każdy typ usługi SQL Warehouse ma różne cechy wydajności.

Bezserwerowe magazyny SQL

Korzystając z architektury bezserwerowej usługi Azure Databricks , bezserwerowy magazyn SQL obsługuje wszystkie funkcje wydajności usługi Databricks SQL. W przypadku bezserwerowej usługi SQL Warehouse i jej funkcji wydajności uzyskujesz następujące możliwości:

Szybki czas uruchamiania (zazwyczaj od 2 do 6 sekund).
Szybkie skalowanie w celu uzyskania większej ilości zasobów obliczeniowych w razie potrzeby utrzymania małych opóźnień.
Przetwarzanie zapytań jest bliższe ograniczeniom sprzętowym niż ograniczeniom maszyny wirtualnej.
Szybkie zmniejszanie skali w celu zminimalizowania kosztów, gdy zapotrzebowanie jest niskie, zapewniając równomierną wydajność przy zoptymalizowanych kosztach i zasobach.

Wybierz bezserwerową usługę SQL Warehouse, aby uzyskać najlepszą wydajność uruchamiania, najbardziej wydajne we/wy, inteligentniejszą obsługę zapotrzebowania na zapytania, które różni się znacznie w czasie, i szybkie skalowanie automatyczne podczas kolejkowania zapytań. Zobacz Bezserwerowe skalowanie automatyczne i kolejkowanie zapytań.

Usługa SQL Warehouse bezserwerowa działa dobrze z następującymi typami obciążeń:

ETL
Analiza biznesowa
Analiza eksploracyjna

Ważny

Magazyny SQL nie obsługują przekazywania poświadczeń użytkownika . Databricks zaleca korzystanie z Unity Catalog w celu zapewnienia ładu danych. Zobacz Co to jest Katalog Unity?.

Magazyny Pro SQL

Usługa Pro SQL Warehouse obsługuje Photon i Predykcyjne IO, ale nie obsługuje Inteligentnego Zarządzania Obciążeniami. W przypadku usługi Pro SQL Warehouse (w przeciwieństwie do bezserwerowego magazynu SQL Warehouse) warstwa obliczeniowa istnieje na twoim koncie subskrypcji platformy Azure, a nie na koncie usługi Azure Databricks. Bez inteligentnego zarządzania obciążeniami magazyny są mniej reagujące na zapotrzebowanie na zapytania, które znacznie się zmieniają w czasie i nie mogą być skalowane automatycznie tak szybko, jak bezserwerowy magazyn SQL Warehouse. Uruchomienie Pro SQL Warehouse trwa kilka minut (zazwyczaj około 4 minut) i wykazuje mniejszą szybkość reakcji przy skalowaniu w górę i w dół niż magazyn SQL bez serwera. Zobacz Kolejkowanie i automatyczne skalowanie dla magazynów SQL w wersji pro i klasycznej.

Użyj usługi Pro SQL Warehouse, gdy:

Bezserwerowe magazyny SQL nie są dostępne w regionie.
Masz niestandardowo zdefiniowaną infrastrukturę sieciową i chcesz połączyć się z bazami danych w sieci w środowisku chmury lub lokalnie dla federacji lub architektury typu hybrydowego. Na przykład użyj usługi Pro SQL Warehouse, jeśli chcesz umieścić inne usługi w sieci, takie jak magistrala zdarzeń lub bazy danych, lub chcesz połączyć sieć z siecią lokalną.

Klasyczne magazyny SQL

Klasyczny magazyn danych SQL obsługuje Photon, ale nie obsługuje Predictive IO ani inteligentnego zarządzania obciążeniem. W przypadku klasycznego magazynu SQL Warehouse (w przeciwieństwie do bezserwerowego magazynu SQL) warstwa obliczeniowa istnieje na koncie subskrypcji platformy Azure, a nie na koncie usługi Azure Databricks. Bez wsparcia dla przewidywalnego wejścia/wyjścia (Predictive IO) lub inteligentnego zarządzania obciążeniem (Intelligent Workload Management), klasyczny magazyn danych SQL oferuje jedynie podstawową wydajność i mniejszą wydajność w porównaniu z bezserwerowym lub zaawansowanym magazynem danych SQL. Uruchomienie klasycznego magazynu SQL zajmuje również kilka minut (zazwyczaj około 4 minut) i charakteryzuje się mniejszą responsywnością w skalowaniu w górę i w dół niż bezserwerowy magazyn SQL. Zobacz Kolejkowanie i automatyczne skalowanie dla magazynów SQL w wersji pro i klasycznej.

Użyj klasycznego magazynu SQL, aby uruchamiać interakcyjne zapytania na potrzeby eksploracji danych przy wydajności na poziomie podstawowym oraz z wykorzystaniem funkcji Databricks SQL.

Notatka

Aby uzyskać informacje na temat określania rozmiaru magazynu SQL i sposobu skalowania w odpowiedzi na kolejkowanie zapytań, zobacz Kolejkowanie i skalowanie automatyczne dla magazynów Pro i klasycznych magazynów SQL.

Jakie są wartości domyślne typu magazynu?

W przypadku obszarów roboczych w regionach ,, które obsługują bezserwerowe magazyny SQL i spełniają wymagania ,:

Przy użyciu interfejsu użytkownika domyślny typ usługi SQL Warehouse jest bezserwerowy.
Używając interfejsu API SQL Warehouses z parametrami domyślnymi, domyślnym typem usługi SQL Warehouse jest klasyczny. Aby użyć parametru bezserwerowego, ustaw parametr enable_serverless_compute na true i warehouse_type na wartość pro. Jeśli ten obszar roboczy używał interfejsu API magazynów SQL do utworzenia magazynu między 1 listopada 2022 r. a 19 maja 2023 r. i spełnia wymagania dotyczące bezserwerowych magazynów SQL Warehouse, wartość domyślna pozostanie ustawiona na true. Aby uniknąć niejednoznaczności, zwłaszcza w przypadku organizacji z wieloma obszarami roboczymi, usługa Databricks zaleca zawsze ustawienie tego pola.
Jeśli obszar roboczy używa starszej wersji zewnętrznego magazynu metadanych Hive, bezserwerowe magazyny SQL nie są obsługiwane. Domyślny typ usługi SQL Warehouse jest taki sam, jak w przypadku wyłączenia bezserwerowych obliczeń, czyli wersji pro w interfejsie użytkownika i klasycznej przy użyciu interfejsu API. Ponadto skontaktuj się z zespołem ds. konta usługi Azure Databricks, aby dowiedzieć się więcej o Unity Catalog lub innych opcjach.

W przypadku obszarów roboczych, które nie obsługują bezserwerowych magazynów SQL:

Przy użyciu interfejsu użytkownika domyślnym typem usługi SQL Warehouse jest pro.
Używając interfejsu API SQL Warehouses z parametrami domyślnymi, domyślnym typem usługi SQL Warehouse jest klasyczny.

Udostępnij za pośrednictwem