Typy usługi SQL Warehouse
Usługa Databricks SQL obsługuje typy bezserwerowe, pro i klasyczne. W tym artykule opisano funkcje dostępne dla każdego typu i porównują wydajność i funkcje.
Możliwości wydajności według typu
Każdy typ usługi SQL Warehouse ma różne możliwości wydajności. W poniższej tabeli przedstawiono funkcje wydajności obsługiwane przez każdy typ magazynu SQL.
Typ magazynu | Aparat fotonów | Predykcyjne wejście/wyjście | Inteligentne zarządzanie obciążeniami |
---|---|---|---|
Bezserwerowy | X | X | X |
Pro | X | X | |
Klasyczny | X |
Poniższa lista zawiera opis każdej funkcji wydajności:
Photon: wbudowany wektoryzowany aparat zapytań w usłudze Databricks. Dzięki temu istniejące wywołania interfejsu API SQL i DataFrame stają się szybsze i zmniejsza całkowity koszt na każdą jednostkę pracy.
Predictive IO: pakiet funkcji przyspieszających operacje skanowania selektywnego w zapytaniach SQL. Predykcyjne we/wy może zapewnić szeroką gamę przyspieszeń.
inteligentne zarządzanie obciążeniami (IWM): zestaw funkcji, które zwiększają zdolność usługi Databricks SQL Serverless do szybkiego i efektywnego kosztowo przetwarzania dużej liczby zapytań. Korzystając z technik przewidywania opartego na sztucznej inteligencji i dynamicznego zarządzania, IWM działa w celu sprawdzenia, czy obciążenia mają odpowiednią ilość zasobów. Kluczową różnicą są możliwości sztucznej inteligencji w usłudze Databricks SQL w celu dynamicznego reagowania na wymagania dotyczące obciążeń, a nie używania progów statycznych.
Notatka
Aby uzyskać cennik dla każdego typu magazynu i szczegółowe porównanie funkcji, zobacz Databricks SQL. Aby dowiedzieć się więcej o najnowszych funkcjach sql usługi Databricks, zobacz Informacje o wersji sql usługi Databricks.
Różnice wydajności między typami usługi SQL Warehouse
Każdy typ usługi SQL Warehouse ma różne cechy wydajności.
Bezserwerowe magazyny SQL
Korzystając z architektury bezserwerowej usługi Azure Databricks , bezserwerowy magazyn SQL obsługuje wszystkie funkcje wydajności usługi Databricks SQL. W przypadku bezserwerowej usługi SQL Warehouse i jej funkcji wydajności uzyskujesz następujące możliwości:
- Szybki czas uruchamiania (zazwyczaj od 2 do 6 sekund).
- Szybkie skalowanie w celu uzyskania większej ilości zasobów obliczeniowych w razie potrzeby utrzymania małych opóźnień.
- Przetwarzanie zapytań jest bliższe ograniczeniom sprzętowym niż ograniczeniom maszyny wirtualnej.
- Szybkie zmniejszanie skali w celu zminimalizowania kosztów, gdy zapotrzebowanie jest niskie, zapewniając równomierną wydajność przy zoptymalizowanych kosztach i zasobach.
Wybierz bezserwerową usługę SQL Warehouse, aby uzyskać najlepszą wydajność uruchamiania, najbardziej wydajne we/wy, inteligentniejszą obsługę zapotrzebowania na zapytania, które różni się znacznie w czasie, i szybkie skalowanie automatyczne podczas kolejkowania zapytań. Zobacz Bezserwerowe skalowanie automatyczne i kolejkowanie zapytań.
Usługa SQL Warehouse bezserwerowa działa dobrze z następującymi typami obciążeń:
- ETL
- Analiza biznesowa
- Analiza eksploracyjna
Ważny
Magazyny SQL nie obsługują przekazywania poświadczeń użytkownika . Databricks zaleca korzystanie z Unity Catalog w celu zapewnienia ładu danych. Zobacz Co to jest Katalog Unity?.
Magazyny Pro SQL
Usługa Pro SQL Warehouse obsługuje Photon i Predykcyjne IO, ale nie obsługuje Inteligentnego Zarządzania Obciążeniami. W przypadku usługi Pro SQL Warehouse (w przeciwieństwie do bezserwerowego magazynu SQL Warehouse) warstwa obliczeniowa istnieje na twoim koncie subskrypcji platformy Azure, a nie na koncie usługi Azure Databricks. Bez inteligentnego zarządzania obciążeniami magazyny są mniej reagujące na zapotrzebowanie na zapytania, które znacznie się zmieniają w czasie i nie mogą być skalowane automatycznie tak szybko, jak bezserwerowy magazyn SQL Warehouse. Uruchomienie Pro SQL Warehouse trwa kilka minut (zazwyczaj około 4 minut) i wykazuje mniejszą szybkość reakcji przy skalowaniu w górę i w dół niż magazyn SQL bez serwera. Zobacz Kolejkowanie i automatyczne skalowanie dla magazynów SQL w wersji pro i klasycznej.
Użyj usługi Pro SQL Warehouse, gdy:
- Bezserwerowe magazyny SQL nie są dostępne w regionie.
- Masz niestandardowo zdefiniowaną infrastrukturę sieciową i chcesz połączyć się z bazami danych w sieci w środowisku chmury lub lokalnie dla federacji lub architektury typu hybrydowego. Na przykład użyj usługi Pro SQL Warehouse, jeśli chcesz umieścić inne usługi w sieci, takie jak magistrala zdarzeń lub bazy danych, lub chcesz połączyć sieć z siecią lokalną.
Klasyczne magazyny SQL
Klasyczny magazyn danych SQL obsługuje Photon, ale nie obsługuje Predictive IO ani inteligentnego zarządzania obciążeniem. W przypadku klasycznego magazynu SQL Warehouse (w przeciwieństwie do bezserwerowego magazynu SQL) warstwa obliczeniowa istnieje na koncie subskrypcji platformy Azure, a nie na koncie usługi Azure Databricks. Bez wsparcia dla przewidywalnego wejścia/wyjścia (Predictive IO) lub inteligentnego zarządzania obciążeniem (Intelligent Workload Management), klasyczny magazyn danych SQL oferuje jedynie podstawową wydajność i mniejszą wydajność w porównaniu z bezserwerowym lub zaawansowanym magazynem danych SQL. Uruchomienie klasycznego magazynu SQL zajmuje również kilka minut (zazwyczaj około 4 minut) i charakteryzuje się mniejszą responsywnością w skalowaniu w górę i w dół niż bezserwerowy magazyn SQL. Zobacz Kolejkowanie i automatyczne skalowanie dla magazynów SQL w wersji pro i klasycznej.
Użyj klasycznego magazynu SQL, aby uruchamiać interakcyjne zapytania na potrzeby eksploracji danych przy wydajności na poziomie podstawowym oraz z wykorzystaniem funkcji Databricks SQL.
Notatka
Aby uzyskać informacje na temat określania rozmiaru magazynu SQL i sposobu skalowania w odpowiedzi na kolejkowanie zapytań, zobacz Kolejkowanie i skalowanie automatyczne dla magazynów Pro i klasycznych magazynów SQL.
Jakie są wartości domyślne typu magazynu?
W przypadku obszarów roboczych w regionach ,, które obsługują bezserwerowe magazyny SQL i spełniają wymagania ,:
- Przy użyciu interfejsu użytkownika domyślny typ usługi SQL Warehouse jest bezserwerowy.
- Używając interfejsu API SQL Warehouses z parametrami domyślnymi, domyślnym typem usługi SQL Warehouse jest klasyczny. Aby użyć parametru bezserwerowego, ustaw parametr
enable_serverless_compute
natrue
iwarehouse_type
na wartośćpro
. Jeśli ten obszar roboczy używał interfejsu API magazynów SQL do utworzenia magazynu między 1 listopada 2022 r. a 19 maja 2023 r. i spełnia wymagania dotyczące bezserwerowych magazynów SQL Warehouse, wartość domyślna pozostanie ustawiona natrue
. Aby uniknąć niejednoznaczności, zwłaszcza w przypadku organizacji z wieloma obszarami roboczymi, usługa Databricks zaleca zawsze ustawienie tego pola. - Jeśli obszar roboczy używa starszej wersji zewnętrznego magazynu metadanych Hive
, bezserwerowe magazyny SQL nie są obsługiwane. Domyślny typ usługi SQL Warehouse jest taki sam, jak w przypadku wyłączenia bezserwerowych obliczeń, czyli wersji pro w interfejsie użytkownika i klasycznej przy użyciu interfejsu API. Ponadto skontaktuj się z zespołem ds. konta usługi Azure Databricks, aby dowiedzieć się więcej o Unity Catalog lub innych opcjach.
W przypadku obszarów roboczych, które nie obsługują bezserwerowych magazynów SQL:
- Przy użyciu interfejsu użytkownika domyślnym typem usługi SQL Warehouse jest pro.
- Używając interfejsu API SQL Warehouses z parametrami domyślnymi, domyślnym typem usługi SQL Warehouse jest klasyczny.