Udostępnij za pośrednictwem


Federacja magazynu metadanych Hive: włącz Unity Catalog, aby zarządzać tabelami zarejestrowanymi w magazynie metadanych Hive.

Ważny

Ta funkcja jest dostępna w wersji zapoznawczej.

W tym artykule przedstawiono federację magazynu metadanych Hive, funkcję, która umożliwia Unity Catalog zarządzać tabelami przechowywanymi w magazynie metadanych Hive. Możesz sfederować zewnętrzny magazyn metadanych Hive lub starszy wewnętrzny magazyn metadanych usługi Azure Databricks Hive.

Federacja metastore Hive może być używana w następujących scenariuszach użycia:

  • Jako krok na ścieżce migracji do Unity Catalog, umożliwiając migrację przyrostową bez dostosowania kodu, przy jednoczesnym kontynuowaniu używania przez niektóre obciążenia danych zarejestrowanych w magazynie metadanych Hive, podczas gdy inne są migrowane.

    Ten przypadek użycia jest najbardziej odpowiedni dla organizacji korzystających ze starszego wewnętrznego magazynu metadanych usługi Azure Databricks Hive, ponieważ federacyjne wewnętrzne magazyny metadanych Hive umożliwiają zarówno obciążenia odczytu, jak i zapisu.

  • Aby zapewnić długoterminowy model hybrydowy dla organizacji, które muszą utrzymywać niektóre dane w metasklepie Hive wraz z danymi zarejestrowanymi w katalogu Unity.

    Ten przypadek użycia jest najbardziej odpowiedni dla organizacji korzystających z zewnętrznego magazynu metadanych Hive, ponieważ federacyjne katalogi dla tych magazynów metadanych Hive są tylko do odczytu.

Diagram przedstawiający federacji Hive

Omówienie federacji repozytorium metadanych Hive

W federacji metadanych Hive tworzysz połączenie między swoim obszarem roboczym Azure Databricks a magazynem metadanych Hive, a Unity Catalog przeszukuje ten magazyn, aby utworzyć katalog federacyjny, co umożliwia organizacji pracę z tabelami w magazynie metadanych Hive w ramach Unity Catalog, zapewniając scentralizowane zarządzanie dostępem, śledzenie pochodzenia, wyszukiwanie i inne funkcje.

Federacyjne magazyny metadanych Hive, które znajdują się poza obszarem roboczym usługi Azure Databricks, umożliwiają odczyty przy użyciu Unity Catalog. Wewnętrzne magazyny metadanych Hive umożliwiają odczyty i zapisy, aktualizując metadane magazynu metadanych Hive oraz metadane Katalogu Unity podczas zapisywania.

Podczas wykonywania zapytań dotyczących federacyjnych zasobów Hive metastore, Unity Catalog zapewnia warstwę zarządzania, wykonując funkcje, takie jak kontrola dostępu i audytowanie, podczas gdy zapytania są wykonywane przy użyciu semantyki Hive metastore. Jeśli na przykład użytkownik wysyła zapytanie do tabeli przechowywanej w formacie Parquet w wykazie federacyjnym, wówczas:

  • Unity Catalog sprawdza, czy użytkownik ma dostęp do tabeli i wnioskuje pochodzenie zapytania.
  • Samo zapytanie jest uruchamiane względem bazowego magazynu metadanych Hive, korzystając z najnowszych metadanych i przechowywanych tam informacji o partycji.

Diagram przedstawiający relację między obciążeniami HMS, Unity Catalog i Databricks w scenariuszu federacji hive

W jaki sposób federacja metastore Hive wypada w porównaniu z używaniem zewnętrznych tabel Unity Catalog?

Katalog Unity potrafi tworzyć tabele zewnętrzne, przetwarzając dane, które już istnieją w jakiejkolwiek lokalizacji magazynu w chmurze i rejestrując je w Katalogu Unity jako tabelę. W tej sekcji omawiane są różnice między zewnętrznymi a federacyjnymi tabelami magazynu metadanych Hive.

Oba typy tabel mają następujące właściwości:

  • Może służyć do zarejestrowania dowolnej lokalizacji w chmurze jako tabeli.
  • Może stosować uprawnienia Unity Catalog i precyzyjne mechanizmy kontroli dostępu.
  • Można wyświetlić w pochodzeniu zapytań, które się do nich odwołują.

Tylko tabele federacyjne mają następujące właściwości:

  • Są automatycznie odnajdywane na podstawie przeszukiwania magazynu metadanych Hive. Po utworzeniu tabel w metastore Hive, są one udostępniane i dostępne do zapytań w zintegrowanym katalogu Unity Catalog.
  • Zezwalaj na definiowanie tabel za pomocą semantyki programu Hive, takich jak Hive SerDes i partycje.
  • Zezwalaj tabelom na nakładanie się ścieżek z innymi tabelami w wykazach federacyjnych.
  • Zezwalaj na umieszczanie tabel w katalogu głównym systemu plików DBFS .
  • Uwzględnij widoki zdefiniowane w repozytorium metadanych Hive.

W ten sposób można myśleć o federacyjnych tabelach metastore Hive jako oferujących zgodność wsteczną z metastore Hive. Dzięki temu obciążenia mogą używać wyłącznie semantyki Hive, ale z zarządzaniem zapewnianym przez katalog Unity.

Jednak niektóre funkcje katalogu Unity nie są dostępne w tabelach federacyjnych, na przykład:

  • Funkcje dostępne tylko dla tabel zarządzanych przez Unity Catalog, takie jak optymalizacja predykcyjna.
  • Wyszukiwanie wektorów, Delta Sharing, monitorowanie Lakehouse i tabele online.
  • Niektóre funkcje magazynu cech, w tym tworzenie magazynu cech, tworzenie serwowania modelu, tworzenie specyfikacji cech, rejestrowanie modeli i ocena wsadowa.

Wydajność może być nieznacznie gorsza niż obciążenia robocze na Unity Catalog lub magazynie metadanych Hive, ponieważ zarówno magazyn metadanych Hive, jak i Unity Catalog są częścią ścieżki zapytania dla tabeli federacyjnej.

Aby uzyskać więcej informacji na temat obsługiwanych funkcji, zobacz wymagania , obsługiwane funkcje i ograniczenia.

Co to znaczy pisać do federacyjnego katalogu metadanych Hive w Azure Databricks?

Zapisy są obsługiwane tylko w przypadku federacyjnych wewnętrznych repozytoriów metadanych Hive, a nie zewnętrznych repozytoriów metadanych Hive.

Operacje zapisu w federacyjnych magazynach metadanych mają dwa typy:

  • Operacje DDL, takie jak CREATE TABLE, ALTER TABLEi DROP TABLE.

    Operacje DDL są synchronicznie odzwierciedlane w bazowym magazynie metadanych Hive. Na przykład uruchomienie instrukcji CREATE TABLE powoduje utworzenie tabeli w magazynie metadanych Hive i katalogu federacyjnym.

    Ostrzeżenie

    Oznacza to również, że polecenia DROP są odzwierciedlane w magazynie metadanych Hive. Na przykład DROP SCHEMA mySchema CASCADE odrzuca wszystkie tabele w podstawowym schemacie magazynu metadanych Hive bez opcji UNDROP, ponieważ magazyn metadanych Hive nie obsługuje UNDROP.

  • Operacje DML, takie jak INSERT, UPDATEi DELETE.

    Operacje DML są również synchronicznie rejestrowane w podstawowej tabeli magazynu metadanych Hive. Na przykład, uruchomienie INSERT INTO dodaje rekordy do tabeli w repozytorium metadanych Hive.

    Obsługa zapisu to klucz do umożliwienia bezproblemowego przejścia podczas migracji z magazynu metadanych Hive do Unity Catalog. Zobacz Jak korzystać z federacji magazynu metadanych Hive podczas migracji do Unity Catalog?.

Jak skonfigurować federację magazynu metadanych Hive?

Aby skonfigurować federację magazynu metadanych Hive, należy wykonać następujące czynności:

  1. Utwórz połączenie w katalogu Unity, które określa ścieżkę i poświadczenia na potrzeby uzyskiwania dostępu do magazynu metadanych Hive.

    Federacja magazynu metadanych Hive używa tego połączenia do przeszukiwania magazynu metadanych Hive. W przypadku większości systemów baz danych należy podać nazwę użytkownika i hasło. W przypadku połączenia ze starszym wewnętrznym obszarem roboczym Azure Databricks z metadanymi Hive, federacja magazynu metadanych Hive zajmuje się autoryzacją.

  2. Utwórz poświadczenie magazynowe i lokalizację zewnętrzną w Unity Catalog dla ścieżek do tabel zarejestrowanych w magazynie metadanych Hive.

    Lokalizacje zewnętrzne zawierają ścieżki i poświadczenia magazynu wymagane do uzyskania dostępu do tych ścieżek. Poświadczenia magazynu to obiekty Unity Catalog, które mogą być zabezpieczone i określają poświadczenia, takie jak zarządzane tożsamości Azure, w celu uzyskania dostępu do magazynu w chmurze. W zależności od przepływu pracy wybranego do tworzenia lokalizacji zewnętrznych może być konieczne utworzenie poświadczeń magazynu przed utworzeniem lokalizacji zewnętrznej.

  3. Utwórz katalog federacyjny dostępny w katalogu Unity przy użyciu połączenia utworzonego w kroku 1.

    To jest katalog, którego używają użytkownicy obszaru roboczego i przepływy pracy do pracy z tabelami metastore Hive przy użyciu katalogu Unity. Po utworzeniu katalogu federacyjnego, katalog Unity wypełnia go tabelami zarejestrowanymi w magazynie metadanych Hive.

  4. Udziel uprawnień tabelom w katalogu federacyjnym przy użyciu Unity Catalog.

    Możesz również użyć filtrów wierszy i kolumn katalogu Unity w celu uzyskania szczegółowej kontroli dostępu.

  5. Rozpocznij wykonywanie zapytań dotyczących danych.

    Dostęp do danych federacyjnych przy użyciu Unity Catalog jest tylko do odczytu w przypadku zewnętrznych magazynów metadanych Hive, a do odczytu i zapisu w przypadku wewnętrznych magazynów metadanych Hive.

    W przypadku wewnętrznych i zewnętrznych magazynów metadanych Hive, Unity Catalog stale aktualizuje metadane tabeli wraz z ich zmianami w magazynie metadanych Hive. W przypadku wewnętrznych magazynów metadanych Hive nowe tabele i aktualizacje tabel zatwierdzone w katalogu federacyjnym są zapisywane ponownie w magazynie metadanych Hive, zachowując pełne współdziałanie między katalogami Unity i magazynami metadanych Hive.

Aby uzyskać szczegółowe instrukcje, zobacz:

Jak korzystać z federacji metastore Hive podczas migracji do Unity Catalogu?

Federacja magazynu metadanych Hive umożliwia stopniową migrację do Unity Catalog, zmniejszając konieczność koordynacji między zespołami i obciążeniami. W szczególności, jeśli migrujesz z wewnętrznego metamagazynu Hive w obszarze roboczym Azure Databricks, możliwość jednoczesnego odczytu i zapisu w zarówno metamagazynie Hive, jak i Unity Catalog, oznacza, że podczas migracji możesz utrzymać „odwzorowane” metamagazyny, co zapewnia następujące korzyści:

  • Obciążenia uruchamiane względem katalogów federacyjnych działają w trybie zgodności magazynu metadanych Hive, co zmniejsza koszt adaptacji kodu podczas migracji.
  • Każde obciążenie pracą może zdecydować się na migrację niezależnie od innych, wiedząc, że w okresie migracji dane będą dostępne zarówno w magazynie metadanych Hive, jak i w Katalogu Unity, redukując potrzebę koordynacji między obciążeniami o wzajemnych zależnościach.

Diagram dający przegląd federacji HMS w kontekście migracji

W tej sekcji opisano typowy przepływ pracy migracji wewnętrznego starszego składu metadanych Hive obszaru roboczego usługi Azure Databricks do Unity Catalog, z federacją składu metadanych Hive, co ułatwia przejście. Nie dotyczy migrowania zewnętrznego magazynu metadanych Hive. Katalogi federacyjne dla zewnętrznych magazynów metadanych Hive nie obsługują zapisów.

Krok 1: Federacja wewnętrznego magazynu metadanych Hive

W tym kroku utworzysz zunifikowany katalog, który dubluje magazyn metadanych Hive w Unity Catalog. Nazwijmy to hms_in_uc.

Diagram przedstawiający obciążenia działające w magazynie metadanych Hive i istnienie dublowanego skatalogowanego zbioru Unity, hms_in_uc

Notatka

W ramach procesu federacyjnego należy skonfigurować lokalizacje zewnętrzne w celu zapewnienia dostępu do danych w magazynie w chmurze. W scenariuszach migracji, w których niektóre zadania wysyłają zapytania do danych przy użyciu starszych mechanizmów dostępu, a inne zadania wysyłają zapytania do tych samych danych w Unity Catalog, zarządzane przez Unity Catalog kontrole dostępu w lokalizacjach zewnętrznych mogą uniemożliwić starszym zadaniom uzyskiwanie dostępu do ścieżek do magazynu z jednostek obliczeniowych obsługujących Unity Catalog. Możesz włączyć "tryb rezerwowy" w tych lokalizacjach zewnętrznych, aby wrócić do wszystkich poświadczeń w zakresie klastra lub notesu, które zostały zdefiniowane dla starszego obciążenia. Następnie po zakończeniu migracji należy wyłączyć tryb rezerwowy. Zobacz Co to jest tryb rezerwowy?.

Aby uzyskać szczegółowe informacje, zobacz Włącz federację bazy danych metastore Hive dla metastore Hive przestrzeni roboczej w wersji starszej.

Krok 2. Uruchamiaj nowe obciążenia w ramach katalogu federacyjnego Unity Catalog

Jeśli masz katalog federacyjny, możesz udzielić analitykom SQL i konsumentom nauki o danych dostępu do niego i rozpocząć opracowywanie nowych obciążeń, które wskazują na nie. Nowe obciążenia korzystają z dodatkowego zestawu funkcji w katalogu Unity, w tym kontroli dostępu, wyszukiwania i pochodzenia danych.

Diagram przedstawiający istniejące obciążenia uruchomione w magazynie metadanych Hive i nowe obciążenia uruchomione w lustrzanym katalogu federacyjnym Unity Catalog, hms_in_uc

W tym kroku zazwyczaj są wykonywane następujące czynności:

  • Wybierz środowisko obliczeniowe zgodne z Unity Catalog (czyli tryby dostępu dla jednego użytkownika lub współdzielonego klastra, magazyny danych SQL lub obliczenia bezserwerowe). Zobacz wymagania , obsługiwane funkcje i ograniczenia.
  • Ustaw katalog federacyjny jako domyślny katalog na zasobie obliczeniowym lub dodaj USE CATALOG hms_in_uc na początku kodu. Ponieważ schematy i nazwy tabel w wykazie federacyjnym są dokładnymi duplikatami tych w magazynie metadanych Hive, kod zacznie odwoływać się do katalogu federacyjnego.

Krok 3. Migracja istniejących zadań do uruchomienia wobec katalogu federacyjnego

Aby przeprowadzić migrację istniejących zadań w celu wykonywania zapytań dotyczących wykazu federacyjnego:

  1. Zmień domyślny wykaz w klastrze zadań na hms_in_uc, ustawiając właściwość w samym klastrze lub dodając USE CATALOG hms_in_uc w górnej części kodu.
  2. Przełącz zadanie na środowisko obliczeniowe w trybie pojedynczego użytkownika lub dostępu współdzielonego i uaktualnij je do jednej z wersji środowiska Databricks Runtime obsługującej federację magazynu metadanych Hive. Zobacz wymagania , obsługiwane funkcje i ograniczenia.
  3. Poproś administratora Azure Databricks o przyznanie odpowiednich uprawnień Unity Catalog do obiektów danych w hms_in_uc oraz wszystkich ścieżek do magazynu w chmurze (zawartych w lokalizacjach zewnętrznych Unity Catalog), do których uzyskuje dostęp zadanie. Zobacz Zarządzanie uprawnieniami w Unity Catalog.

drugie wystąpienie diagramu, które zawiera omówienie federacji HMS w kontekście migracji

Krok 4. Odmowa dostępu do magazynu metadanych Hive

Po przeprowadzeniu migracji wszystkich obciążeń w celu wykonywania zapytań dotyczących wykazu federacyjnego nie potrzebujesz już magazynu metadanych Hive. Możesz użyć starszych kontrolek dostępu do tabel i uprawnień obliczeniowych, aby zablokować bezpośredni dostęp z obszaru roboczego usługi Azure Databricks do magazynu metadanych Hive. Możesz na przykład:

  1. Cofnijcie wszystkie uprawnienia dla obiektów w katalogu metadanych Hive.

    Polecenie MSCK REPAIR PRIVILEGES jest wygodne w tym celu. Zapoznaj się z uprawnieniami magazynu metadanych Hive MSCK REPAIR PRIVILEGES i oraz obiektami zabezpieczalnymi (starsza wersja).

  2. Zapobieganie użytkownikom w tworzeniu i używaniu klastrów, które omijają kontrolę dostępu do tabel (czyli klastrów, które nie używają trybu dostępu współdzielonego bez izolacji lub starszego niestandardowego typu klastra) poprzez zastosowanie polityk obliczeniowych.

    Zobacz Zarządzanie konfiguracjami obliczeniowymi.

  3. Ustaw katalog federacyjny jako domyślny wykaz obszaru roboczego.

    Zobacz Zarządzanie domyślnym katalogiem.

Często zadawane pytania

Poniższe sekcje zawierają bardziej szczegółowe informacje dotyczące federacji metadanych Hive.

Co to jest tryb rezerwowy?

tryb zapasowy jest ustawieniem w lokalizacjach zewnętrznych, których można użyć do obejścia kontroli uprawnień w Unity Catalog podczas migracji do Unity Catalog. Ustawienie zapewnia, że obciążenia, które nie zostały jeszcze zmigrowane, nie będą miały wpływu na fazę instalacji.

Katalog Unity uzyskuje dostęp do pamięci masowej w chmurze przy użyciu lokalizacji zewnętrznych, które są obiektami, które można zabezpieczyć, definiującymi ścieżkę i poświadczenie dostępu do konta pamięci masowej w chmurze. Możesz wydać im uprawnienia, takie jak READ FILES, aby zarządzać, kto może używać ścieżki. Jednym z wyzwań podczas procesu migracji jest to, że katalog Unity może nie chcieć od razu zarządzać całym dostępem do ścieżki, na przykład w przypadku istniejących, niezmigrowanych obciążeń roboczych odwołujących się do ścieżki.

Tryb awaryjny umożliwia opóźnienie ścisłego egzekwowania kontroli dostępu w katalogu Unity w lokalizacjach zewnętrznych. Kiedy tryb awaryjny jest włączony, zadania, które uzyskują dostęp do ścieżki, są najpierw sprawdzane względem uprawnień katalogu Unity, a jeśli nie powiedzie się, następuje powrót do używania poświadczeń w zakresie klastra lub notatnika, takich jak profile wystąpień lub właściwości konfiguracji Apache Spark. Dzięki temu istniejące obciążenia mogą nadal korzystać z ich bieżącego poświadczenia.

Tryb awaryjny jest przeznaczony tylko do użycia podczas migracji. Należy ją wyłączyć, gdy wszystkie obciążenia zostały zmigrowane i jesteś gotowy, aby wprowadzać kontrole dostępu do Unity Catalog.

Wykonywanie zapytań w dzienniku inspekcji na potrzeby użycia rezerwowego

Użyj następującego zapytania, aby sprawdzić, czy jakikolwiek dostęp do lokalizacji zewnętrznej był używany w trybie rezerwowym w ciągu ostatnich 30 dni. Jeżeli na twoim koncie nie ma dostępu w trybie rezerwowym, Databricks sugeruje, aby wyłączyć tryb rezerwowy.

SELECT event_time, user_identity, action_name, request_params, response, identity_metadata
FROM system.access.audit
WHERE
request_params.fallback_enabled = 'true' AND
request_params.path LIKE '%some-path%' AND
event_time >= current_date() - INTERVAL 30 DAYS
LIMIT 10

Co to są autoryzowane ścieżki?

Podczas tworzenia wykazu federacyjnego będziesz poproszony o podanie autoryzowanych ścieżek do magazynu w chmurze, w którym przechowywane są tabele magazynu metadanych Hive. Każda tabela, do której chcesz uzyskać dostęp przy użyciu federacji magazynu metadanych Hive, musi być objęta tymi ścieżkami. Usługa Databricks zaleca, aby autoryzowane ścieżki zawierały ścieżki podrzędne, które są wspólne dla dużej liczby tabel. Jeśli na przykład masz tabele w abfss://container@storageaccount.dfs.core.windows.net/bucket/table1, ./bucket/table2i ./bucket/table3, należy podać abfss://container@storageaccount.dfs.core.windows.net/bucket/ jako autoryzowaną ścieżkę.

Możesz użyć UCX, aby ułatwić identyfikowanie ścieżek znajdujących się w magazynie metadanych Hive.

Autoryzowane ścieżki dodają dodatkową warstwę zabezpieczeń w katalogach federacyjnych, umożliwiając właścicielowi wykazu stosowanie barier zabezpieczających do danych, do których użytkownicy mogą uzyskiwać dostęp za pomocą federacji. Jest to przydatne, jeśli magazyn metadanych Hive umożliwia użytkownikom aktualizowanie metadanych i arbitralne zmienianie lokalizacji tabeli — aktualizacje, które w przeciwnym razie zostaną zsynchronizowane z wykazem federacyjnym. W tym scenariuszu użytkownicy mogą potencjalnie ponownie zdefiniować tabele, do których mają już dostęp, tak aby wskazywały nowe lokalizacje, do których w przeciwnym razie nie mieliby dostępu.

Czy mogę sfederować magazyny metadanych Hive przy użyciu interfejsu UCX?

UCX, projekt Databricks Labs do migracji obszarów roboczych Azure Databricks do Unity Catalog, obejmuje narzędzia umożliwiające federację metastore Hive:

  • enable-hms-federation
  • create-federated-catalog

Zobacz plik readme projektu w witrynie GitHub. Aby zapoznać się z wprowadzeniem do UCX, zobacz Użyj narzędzi UCX, aby zaktualizować swoje środowisko pracy do katalożka Unity.

wymagania, obsługiwane funkcje i ograniczenia

W poniższej tabeli wymieniono usługi i funkcje obsługiwane przez federację magazynu metadanych Hive. W niektórych przypadkach wyświetlane są również nieobsługiwane usługi lub funkcje. W tych tabelach "HMS" oznacza magazyn metadanych Hive.

Kategoria Obsługiwane Nieobsługiwany
Magazyny metadanych — Starsze magazyny metadanych Hive obszaru roboczego (wewnętrzne w usłudze Databricks)
— Zewnętrzne magazyny metadanych w usłudze Apache Hive w wersji 0.13 lub 2.3 przy użyciu programu mySQL
- Zewnętrzne magazyny metadanych w bazach danych innych niż mySQL
- Hive 3.1
Operacji - Internal Databricks HMS: odczyty i zapisy
- Zewnętrzny HMS: tylko do odczytu
Zasoby danych magazynu metadanych Hive - Zarządzane i zewnętrzne tabele w systemie metadanych Hive
-Schematów
- Wyświetlenia
- Tabele Hive SerDe
- Funkcje Hive i UDF (funkcje zdefiniowane przez użytkownika)
- Definiowanie nowych płytkich klonów w katalogu federacyjnym
- Tabele oparte na JDBC
— Udostępnione tabele Delta Sharing
- Uzyskiwanie dostępu do płytkich klonów zarejestrowanych w magazynie metadanych Hive za pośrednictwem katalogu federacyjnego
Magazynowanie — Azure Data Lake Storage Gen2
— Tabele odwołujące się do lokalizacji instalacji systemu plików DBFS, w tym katalog główny systemu plików DBFS
- Tabele, których ścieżki nakładają się na inne ścieżki tabeli HMS zdefiniowane w lokalizacjach zewnętrznych
- Tabele HMS, których ścieżki nakładają się na natywne ścieżki obiektów katalogu Unity
- Dostęp do tabel w katalogu głównym systemu plików DBFS lub lokalizacjach instalacji zarejestrowanych w zewnętrznym HMS
- Dostęp do tabel w głównej lokacji DBFS lub zamontowanych lokalizacjach z dowolnego obszaru roboczego poza tym, w którym zdefiniowano wewnętrzny HMS.
obsługa zapory - dla konta magazynu obszaru roboczego
Typy obliczeniowe - Udostępnione klastry
- Klastry przydzielone jednemu użytkownikowi
- Bezserwerowe (wszystkie)
— Magazyny SQL (wszystkie)
Brak klastrów izolacji
Wersje obliczeniowe — Wszystkie kanały SQL usługi Databricks
- Wszystkie kanały Delta Live Tables
— Databricks Runtime 13.3 LTS
— Databricks Runtime 14.3 LTS
— Środowisko Databricks Runtime 15.1 lub nowsze
Funkcje katalogu Unity — Model uprawnień katalogu Unity
- Filtry wierszy i maski kolumn
-Inspekcja
- Pochodzenie podrzędne
- Wyszukiwanie w tabelach
— Dostęp między obszarami roboczymi (z wyjątkiem katalogu głównego i instalacji systemu PLIKÓW DBFS)
— Dostęp do danych ograniczony do zdefiniowanych lokalizacji zewnętrznych
- Delta Sharing
- Monitorowanie lakehouse
- Wyszukiwanie wektorowe
- Tabele online
— Niektóre funkcje magazynu cech, w tym tworzenie magazynu cech, tworzenie usługi modelu, tworzenie specyfikacji cech, rejestrowanie modelu i ocenianie wsadowe
- Nie można zapisywać zmaterializowanych widoków Delta Live Tables i tabel przesyłania strumieniowego do katalogu federacyjnego, ale można użyć zasobów federacyjnych jako źródła dla zmaterializowanych widoków Delta Live Tables i tabel przesyłania strumieniowego.
— Automatyczna migracja starszych list ACL tabel do uprawnień Unity Catalog dla katalogu federacyjnego. UCX może pomóc w tym.