Co jsou schémata v Azure Databricks?
V katalogu Unity je schéma podřízeno katalogu a může obsahovat tabulky, pohledy, svazky, modely a funkce. Schémata poskytují podrobnější kategorie datových organizací než katalogy.
Tento článek popisuje roli schémat v hierarchii datových objektů Azure Databricks v katalogu Unity.
Informace o schématech ve starším metastoru Hive v místním pracovním prostoru najdete v tématu Databázové objekty ve starším metastoru Hive.
Co je schéma?
V systému Unity Catalogje schéma druhou úrovní v rámci tříúrovňového systému názvů Unity (catalog.schema.table-etc
).
Schéma uspořádá data a prostředky AI do logických kategorií, které jsou podrobnější než katalogy. Schéma obvykle představuje jeden případ použití, projekt nebo týmový sandbox. Bez ohledu na typ kategorie jsou schémata užitečným nástrojem pro správu řízení přístupu k datům a zlepšení zjistitelnosti dat.
Poznámka:
V Azure Databricks se schémata někdy označují jako databáze. Například CREATE DATABASE
je alias pro CREATE SCHEMA
. Tato terminologie se liší od některých relačních databázových systémů, ve kterých je databáze kolekcí schémat.
Další informace o hierarchii datových objektů v Katalogu Unity najdete v tématu Co jsou databázové objekty v Azure Databricks?.
Spravovaná umístění pro schémata
V katalogu Unity můžete fyzicky izolovat data pro všechny spravované tabulky a spravované svazky v rámci schématu od těch v jiných schématech v katalogu tím, že určíte spravované umístění úložiště pro dané schéma. To je zcela volitelné. Pokud pro schéma nezadáte spravované umístění úložiště, data se nacházejí ve spravovaném umístění úložiště katalogu (a pokud není pro katalog definován žádný, nachází se ve spravovaném umístění úložiště metastoru). Viz Určete spravované umístění úložiště v katalogu Unity.
Izolace dat pro externí tabulky a svazky závisí na tom, jak spravujete data ve vašem cloudovém úložišti. Je nezávislý na spravovaném umístění schématu.