Udostępnij za pośrednictwem


Typy usługi SQL Warehouse

Usługa Databricks SQL obsługuje typy bezserwerowe, pro i klasyczne. W tym artykule opisano funkcje dostępne dla każdego typu i porównują wydajność i funkcje.

Możliwości wydajności według typu

Każdy typ usługi SQL Warehouse ma różne możliwości wydajności. W poniższej tabeli przedstawiono funkcje wydajności obsługiwane przez każdy typ magazynu SQL.

Typ magazynu Aparat fotonów Predykcyjne wejście/wyjście Inteligentne zarządzanie obciążeniami
Bezserwerowy X X X
Pro X X
Klasyczny X

Poniższa lista zawiera opis każdej funkcji wydajności:

  • Photon: wbudowany wektoryzowany aparat zapytań w usłudze Databricks. Dzięki temu istniejące wywołania interfejsu API SQL i DataFrame stają się szybsze i zmniejsza całkowity koszt na każdą jednostkę pracy.

  • Predictive IO: pakiet funkcji przyspieszających operacje skanowania selektywnego w zapytaniach SQL. Predykcyjne we/wy może zapewnić szeroką gamę przyspieszeń.

  • inteligentne zarządzanie obciążeniami (IWM): zestaw funkcji, które zwiększają zdolność usługi Databricks SQL Serverless do szybkiego i efektywnego kosztowo przetwarzania dużej liczby zapytań. Korzystając z technik przewidywania opartego na sztucznej inteligencji i dynamicznego zarządzania, IWM działa w celu sprawdzenia, czy obciążenia mają odpowiednią ilość zasobów. Kluczową różnicą są możliwości sztucznej inteligencji w usłudze Databricks SQL w celu dynamicznego reagowania na wymagania dotyczące obciążeń, a nie używania progów statycznych.

    Notatka

    Aby uzyskać cennik dla każdego typu magazynu i szczegółowe porównanie funkcji, zobacz Databricks SQL. Aby dowiedzieć się więcej o najnowszych funkcjach sql usługi Databricks, zobacz Informacje o wersji sql usługi Databricks.

Różnice wydajności między typami usługi SQL Warehouse

Każdy typ usługi SQL Warehouse ma różne cechy wydajności.

Bezserwerowe magazyny SQL

Korzystając z architektury bezserwerowej usługi Azure Databricks , bezserwerowy magazyn SQL obsługuje wszystkie funkcje wydajności usługi Databricks SQL. W przypadku bezserwerowej usługi SQL Warehouse i jej funkcji wydajności uzyskujesz następujące możliwości:

  • Szybki czas uruchamiania (zazwyczaj od 2 do 6 sekund).
  • Szybkie skalowanie w celu uzyskania większej ilości zasobów obliczeniowych w razie potrzeby utrzymania małych opóźnień.
  • Przetwarzanie zapytań jest bliższe ograniczeniom sprzętowym niż ograniczeniom maszyny wirtualnej.
  • Szybkie zmniejszanie skali w celu zminimalizowania kosztów, gdy zapotrzebowanie jest niskie, zapewniając równomierną wydajność przy zoptymalizowanych kosztach i zasobach.

Wybierz bezserwerową usługę SQL Warehouse, aby uzyskać najlepszą wydajność uruchamiania, najbardziej wydajne we/wy, inteligentniejszą obsługę zapotrzebowania na zapytania, które różni się znacznie w czasie, i szybkie skalowanie automatyczne podczas kolejkowania zapytań. Zobacz Bezserwerowe skalowanie automatyczne i kolejkowanie zapytań.

Usługa SQL Warehouse bezserwerowa działa dobrze z następującymi typami obciążeń:

  • ETL
  • Analiza biznesowa
  • Analiza eksploracyjna

Ważny

Magazyny SQL nie obsługują przekazywania poświadczeń użytkownika . Databricks zaleca korzystanie z Unity Catalog w celu zapewnienia ładu danych. Zobacz Co to jest Katalog Unity?.

Magazyny Pro SQL

Usługa Pro SQL Warehouse obsługuje Photon i Predykcyjne IO, ale nie obsługuje Inteligentnego Zarządzania Obciążeniami. W przypadku usługi Pro SQL Warehouse (w przeciwieństwie do bezserwerowego magazynu SQL Warehouse) warstwa obliczeniowa istnieje na twoim koncie subskrypcji platformy Azure, a nie na koncie usługi Azure Databricks. Bez inteligentnego zarządzania obciążeniami magazyny są mniej reagujące na zapotrzebowanie na zapytania, które znacznie się zmieniają w czasie i nie mogą być skalowane automatycznie tak szybko, jak bezserwerowy magazyn SQL Warehouse. Uruchomienie Pro SQL Warehouse trwa kilka minut (zazwyczaj około 4 minut) i wykazuje mniejszą szybkość reakcji przy skalowaniu w górę i w dół niż magazyn SQL bez serwera. Zobacz Kolejkowanie i automatyczne skalowanie dla magazynów SQL w wersji pro i klasycznej.

Użyj usługi Pro SQL Warehouse, gdy:

  • Bezserwerowe magazyny SQL nie są dostępne w regionie.
  • Masz niestandardowo zdefiniowaną infrastrukturę sieciową i chcesz połączyć się z bazami danych w sieci w środowisku chmury lub lokalnie dla federacji lub architektury typu hybrydowego. Na przykład użyj usługi Pro SQL Warehouse, jeśli chcesz umieścić inne usługi w sieci, takie jak magistrala zdarzeń lub bazy danych, lub chcesz połączyć sieć z siecią lokalną.

Klasyczne magazyny SQL

Klasyczny magazyn danych SQL obsługuje Photon, ale nie obsługuje Predictive IO ani inteligentnego zarządzania obciążeniem. W przypadku klasycznego magazynu SQL Warehouse (w przeciwieństwie do bezserwerowego magazynu SQL) warstwa obliczeniowa istnieje na koncie subskrypcji platformy Azure, a nie na koncie usługi Azure Databricks. Bez wsparcia dla przewidywalnego wejścia/wyjścia (Predictive IO) lub inteligentnego zarządzania obciążeniem (Intelligent Workload Management), klasyczny magazyn danych SQL oferuje jedynie podstawową wydajność i mniejszą wydajność w porównaniu z bezserwerowym lub zaawansowanym magazynem danych SQL. Uruchomienie klasycznego magazynu SQL zajmuje również kilka minut (zazwyczaj około 4 minut) i charakteryzuje się mniejszą responsywnością w skalowaniu w górę i w dół niż bezserwerowy magazyn SQL. Zobacz Kolejkowanie i automatyczne skalowanie dla magazynów SQL w wersji pro i klasycznej.

Użyj klasycznego magazynu SQL, aby uruchamiać interakcyjne zapytania na potrzeby eksploracji danych przy wydajności na poziomie podstawowym oraz z wykorzystaniem funkcji Databricks SQL.

Notatka

Aby uzyskać informacje na temat określania rozmiaru magazynu SQL i sposobu skalowania w odpowiedzi na kolejkowanie zapytań, zobacz Kolejkowanie i skalowanie automatyczne dla magazynów Pro i klasycznych magazynów SQL.

Jakie są wartości domyślne typu magazynu?

W przypadku obszarów roboczych w regionach ,, które obsługują bezserwerowe magazyny SQL i spełniają wymagania ,:

  • Przy użyciu interfejsu użytkownika domyślny typ usługi SQL Warehouse jest bezserwerowy.
  • Używając interfejsu API SQL Warehouses z parametrami domyślnymi, domyślnym typem usługi SQL Warehouse jest klasyczny. Aby użyć parametru bezserwerowego, ustaw parametr enable_serverless_compute na true i warehouse_type na wartość pro. Jeśli ten obszar roboczy używał interfejsu API magazynów SQL do utworzenia magazynu między 1 listopada 2022 r. a 19 maja 2023 r. i spełnia wymagania dotyczące bezserwerowych magazynów SQL Warehouse, wartość domyślna pozostanie ustawiona na true. Aby uniknąć niejednoznaczności, zwłaszcza w przypadku organizacji z wieloma obszarami roboczymi, usługa Databricks zaleca zawsze ustawienie tego pola.
  • Jeśli obszar roboczy używa starszej wersji zewnętrznego magazynu metadanych Hive, bezserwerowe magazyny SQL nie są obsługiwane. Domyślny typ usługi SQL Warehouse jest taki sam, jak w przypadku wyłączenia bezserwerowych obliczeń, czyli wersji pro w interfejsie użytkownika i klasycznej przy użyciu interfejsu API. Ponadto skontaktuj się z zespołem ds. konta usługi Azure Databricks, aby dowiedzieć się więcej o Unity Catalog lub innych opcjach.

W przypadku obszarów roboczych, które nie obsługują bezserwerowych magazynów SQL:

  • Przy użyciu interfejsu użytkownika domyślnym typem usługi SQL Warehouse jest pro.
  • Używając interfejsu API SQL Warehouses z parametrami domyślnymi, domyślnym typem usługi SQL Warehouse jest klasyczny.