Co jsou schémata v Azure Databricks?
Ve službě Unity Catalogje schema potomkem catalog a může zahrnovat tables, views, volumes, modely a funkce. Schémata poskytují podrobnější kategorie organizace dat než catalogs.
Tento článek popisuje roli schémat v hierarchii datových objektů Azure Databricks v Unity Catalog.
Informace o schématech ve starším metastoru Hive v místním pracovním prostoru najdete v tématu Databázové objekty ve starším metastoru Hive.
Co je schema?
v Unity Catalogje schema druhou úrovní oboru názvů Unity Catalogtříúrovňového oboru názvů (catalog.schema.table-etc
).
schema uspořádá data a prostředky AI do logických kategorií, které jsou podrobnější než catalogs. Obvykle schema představuje jeden případ použití, projekt nebo týmový sandbox. Bez ohledu na typ kategorie jsou schémata užitečným nástrojem pro správu řízení přístupu k datům a zlepšení zjistitelnosti dat.
Poznámka:
V Azure Databricks se schémata někdy označují jako databáze. Například CREATE DATABASE
je alias pro CREATE SCHEMA
. Tato terminologie se liší od některých relačních databázových systémů, ve kterých je databáze kolekcí schémat.
Další informace o hierarchii datových objektů v Unity Catalognajdete v tématu Co jsou databázové objekty v Azure Databricks?.
Spravovaná umístění pro schémata
V Unity Catalog můžete fyzicky izolovat data pro všechny spravované tables a spravované volumes v schema z jiných schémat v catalog zadáním spravovaného umístění úložiště pro schema. To je zcela volitelné. Pokud pro schemanezadáte spravované umístění úložiště, data se nacházejí v umístění spravovaného úložiště catalog(a pokud pro catalognení definováno žádné, nachází se ve spravovaném umístění úložiště metastoru). Viz Určení spravovaného umístění úložiště v Unity Catalog.
Izolace dat pro externí tables a volumes závisí na tom, jak spravujete data v cloudovém úložišti. Je nezávislá na spravovaném umístění schema.