Vytvoření externího umístění pro data v kořenovém adresáři DBFS
Tento článek ukazuje, jak nakonfigurovat externí umístění v Unity Catalog pro řízení přístupu ke kořenovému umístění úložiště DBFS. Ačkoli Databricks doporučuje neukládat data do kořenového úložiště DBFS, váš pracovní prostor to může učinit kvůli starším postupům.
externích umístění jsou zabezpečitelné objekty Unity Catalog, které přidružují credentials úložiště ke kontejnerům cloudového úložiště objektů. Externí umístění slouží k definování spravovaných umístění úložiště pro spravované tables a volumesa k řízení přístupu k umístěním úložiště, která obsahují externí tables a externí volumes.
Pokud váš pracovní prostor uložený lokálně, starší metastor Azure Databricks Hive ukládá data do kořenového adresáře DBFS, musíte vytvořit externí umístění. Chcete-li federovat váš starší metastore Hive, aby váš tým mohl pracovat s metastorem Hive tables pomocí Unity Catalog. Viz federaci metastoru Hive: Povolení Catalog Unity řídit tables zaregistrované v metastoru Hive a Povolit federaci metastoru Hive pro starší verzi pracovního prostorumetastore Hive .
Než začnete
Pokud chcete vytvořit externí umístění pro kořen DBFS, musíte mít přihlašovací údaje úložiště definované v Unity Catalog, které poskytují přístup k umístění cloudového úložiště DBFS. Pokud ho ještě nemáte, systém ho může vytvořit během procesu vytváření externího umístění.
požadavky na oprávnění :
Musíte mít oprávnění
CREATE STORAGE CREDENTIAL
aCREATE EXTERNAL LOCATION
v metastore. Správci metastoru mají tato oprávnění ve výchozím nastavení.Poznámka
Pokud přihlašovací údaje úložiště pro umístění úložiště kořenového adresáře DBFS již existují, uživatel, který vytvoří externí umístění, nepotřebuje
CREATE STORAGE CREDENTIAL
, ale potřebujeCREATE EXTERNAL LOCATION
na přihlašovacích údajích úložiště i metastoru.Aby vám systém během vytváření externího umístění vytvořil přihlašovací údaje k úložišti, musíte být správcem pracovního prostoru.
Pokud přihlašovací údaje úložiště, které poskytují přístup k kořenovému úložišti DBFS, už existují a máte
CREATE EXTERNAL LOCATION
přihlašovacích údajů úložiště i metastoru, nemusíte být správcem pracovního prostoru.
Vytvořte externí umístění
Průzkumníka Catalog můžete použít k vytvoření externího umístění pro kořen DBFS.
Na bočním panelu klikněte na
Catalog.
Klikněte na Externí data > a Vytvořit externí umístění.
Zadejte název externího umístění.
V části URLklikněte na Kopírovat z připojení DBFS a selectKopírovat z kořenového adresáře DBFS.
Pole adresy URL a dílčí cesty jsou naplněna cestou cloudového úložiště ke kořenovému adresáři DBFS.
Důležitý
Při vytváření externího umístění pro kořen DBFS je nutné použít dílčí cestu k kořenovému umístění DBFS, nikoli cestu k celému kontejneru. Podcesta je předem vyplněna
user/hive/warehouse
, což je výchozí umístění úložiště pro Hive metastore tables. Pokud chcete podrobnější řízení přístupu k datům v kořenovém adresáři DBFS, můžete vytvořit samostatná externí umístění pro dílčí cesty v kořenovém adresáři DBFS.Varování
Váš kořen DBFS může být uložený ve službě Azure Blob Storage místo Azure Data Lake Storage Gen2. K těmto umístěním se přistupuje pomocí ovladače
wasb
, který neumožňuje ovládací prvky na úrovni adresáře nebo souboru. Proto unity Catalog může vynutit řízení přístupu pouze na úrovni kontejneru, což znamená, že uživatelé s přístupem k tomuto externímu umístění můžou potenciálně přistupovat k jiným datům ve stejném kontejneru, pokud používají clustery s režimem přístupu jednoho uživatele. Pokud tomu chcete zabránit, vynucujte použití clusterů režimu sdíleného přístupu, SQL Warehouse nebo bezserverových výpočetních prostředků.Select přihlašovací údaje úložiště, které udělují přístup ke kořenovému cloudovému úložišti DBFS. Pokud žádné nejsou definovány, zvolte možnost + Vytvořit nové přihlašovací údaje úložiště.
K vytvoření přihlašovacích údajů úložiště: select typ přihlašovacích údajů kořene DBFS. Přihlašovací údaje úložiště se vytvoří automaticky při uložení externího umístění.
(Volitelné) Přidejte komentář.
(Volitelné) Klepněte na Rozšířené možnosti a povolte záložní režim.
Záložní režim je určený pro scénáře migrace starších verzí úloh. Viz Povolit záložní režim na externích umístěních.
Klikněte na Vytvořit.
Přejděte na kartu Oprávnění a grant oprávnění k používání externího umístění.
- Klikněte na Grant.
- Select uživatele, skupiny nebo instanční objekty v poli objekty zabezpečení a select oprávnění, která chcete grant.
- Klikněte na Grant.
(Volitelné) Set pracovních prostorů, které mají přístup k tomuto externímu umístění.
Ve výchozím nastavení mohou mít uživatelé v jakémkoli pracovním prostoru, který používá tento metastor Unity Catalog, udělen přístup k datům v tomto umístění. Můžete limit přístup ke konkrétním pracovním prostorům. Databricks doporučuje omezit přístup k pracovnímu prostoru, ve které je kořen DBFS.
Podívejte se na Připojte externí umístění k jednomu nebo více pracovním prostorům.