Skapa kataloger
Den här artikeln visar hur du skapar kataloger i Unity Catalog. En katalog innehåller scheman (databaser) och ett schema innehåller tabeller, vyer, volymer, modeller och funktioner.
Mer information om kataloger finns i Vad är kataloger i Azure Databricks?.
Kommentar
Information om hur du skapar en utländsk katalog, ett Unity Catalog-objekt som speglar en databas i ett externt datasystem, finns i Skapa en sekundär katalog. Se även Hantera och arbeta med utländska kataloger.
Krav
Så här skapar du en katalog, oavsett katalogtyp:
- Du måste vara administratör för Azure Databricks-metaarkivet eller ha behörighet för
CREATE CATALOG
metaarkivet. - Den beräkningsresurs som du använder för att köra en notebook-fil för att skapa en katalog måste finnas på Databricks Runtime 11.3 eller senare och måste använda ett Åtkomstläge som är kompatibelt med Unity Catalog. Se Åtkomstlägen. SQL-lager stöder alltid Unity Catalog.
Så här skapar du en delad katalog:
- Deltadelningsresursen måste redan finnas på din arbetsyta. Se Hur gör jag för att göra delade data tillgängliga för mitt team?.
- Du måste vara metaarkivadministratör, ha
USE PROVIDER
behörighet på metaarkivet eller äga providerobjektet som innehåller resursen.
Så här skapar du en standardkatalog:
- Om du anger en hanterad lagringsplats för katalogen måste du ha behörigheten
CREATE MANAGED STORAGE
på den externa målplatsen. - Om det inte finns någon hanterad lagring på metaarkivnivå måste du ange en hanterad lagringsplats för katalogen.
Så här skapar du en sekundär katalog:
- Du måste antingen vara ägare till den anslutning som du använder för att skapa den externa katalogen eller ha behörighet för
CREATE FOREIGN CATALOG
anslutningen. - Du måste använda beräkning på Databricks Runtime 13.1 eller senare. SQL-lager måste vara Pro eller Serverless.
Skapa en katalog
Om du vill skapa en katalog kan du använda Catalog Explorer, ett SQL-kommando, REST-API:et, Databricks CLI eller Terraform. När du skapar en katalog skapas två scheman (databaser) automatiskt: default
och information_schema
.
Katalogutforskaren
Logga in på en arbetsyta som är länkad till metaarkivet.
Klicka på Katalog.
Klicka på knappen Skapa katalog .
I dialogrutan Skapa en ny katalog anger du ett katalognamn och väljer den katalogtyp som du vill skapa:
- Standardkatalog : ett skyddsbart objekt som organiserar data och AI-tillgångar som hanteras av Unity Catalog. För alla användningsfall utom Lakehouse Federation och kataloger som skapats från Delta Sharing-resurser.
- Sekundär katalog: ett skyddsbart objekt som speglar en databas i ett externt datasystem med hjälp av Lakehouse Federation. Se Översikt över Konfiguration av Lakehouse Federation.
- Delad katalog: ett skyddsbart objekt som organiserar data och andra tillgångar som delas med dig som en deltadelningsresurs. Om du skapar en katalog från en resurs blir dessa tillgångar tillgängliga för användare på din arbetsyta att läsa. Se Vad är en resurs?.
Beroende på katalogtyp anger du följande alternativ:
För standardkataloger: Det är valfritt men rekommenderas starkt att du anger en hanterad lagringsplats. Du måste ha behörigheten
CREATE MANAGED STORAGE
på den externa målplats som du använder som en hanterad lagringsplats. Se Ange en hanterad lagringsplats i Unity Catalog.Du kan också ange en undersökväg för en definierad extern plats. Om du inte har definierat någon extern plats kan du skapa en genom att klicka på Skapa en ny extern plats.
Viktigt!
Om din arbetsyta inte har någon lagringsplats på metaarkivnivå måste du ange en hanterad lagringsplats när du skapar en katalog.
För utländska kataloger: Du måste välja en anslutning, som är ett skyddsbart objekt i Unity Catalog som anger en sökväg och autentiseringsuppgifter för åtkomst till ett externt databassystem. Se Översikt över Konfiguration av Lakehouse Federation.
När du har valt anslutningen anger du namnet på den databas eller annan Databricks-katalog som du vill spegla.
Kraven varierar beroende på datakällan:
- MySQL använder ett namnområde med två lager och kräver därför inget databasnamn.
- För anslutningar till en katalog på en annan Databricks-arbetsyta anger du Namnet på Databricks-katalogen i stället för ett databasnamn.
Om du inte har definierat någon anslutning kan du skapa en genom att klicka på Skapa en ny anslutning.
För delade kataloger: Du måste välja en provider och en resurs. När du har valt providern kan du välja en av leverantörens resurser.
Om du inte är säker på vilken provider och resurs du vill använda kan det vara enklare att bläddra eller söka efter leverantörer och resurser med hjälp av webbläsaren Catalog Explorer. Se Visa leverantörer och Visa resurser som en leverantör har delat med dig.
Klicka på Skapa.
I dialogrutan Katalog skapad! klickar du på Visa katalog för att acceptera katalogen som automatiskt konfigurerad, eller klicka på Konfigurera katalog (rekommenderas) för att konfigurera katalogbehörigheter, arbetsytebindningar och metadata.
Om du klickar på Visa katalog blir katalogen tillgänglig för alla arbetsytor som är kopplade till metaarkivet och behörigheten
BROWSE
beviljas alla kontoanvändare. Du kan hoppa över resten av stegen i den här proceduren och fortsätta med att lägga till scheman i katalogen. Se Skapa scheman.Du kan när som helst gå tillbaka till sidan kataloginformation i Katalogutforskaren för att uppdatera ägare, taggar, kommentarer, arbetsytebindningar, behörigheter och scheman.
På sidan > anger du den arbetsyta som katalogen är bunden till.
Som standard delas katalogen med alla arbetsytor som är kopplade till det aktuella metaarkivet. Om katalogen innehåller data som ska begränsas till specifika arbetsytor avmarkerar du alternativet Alla arbetsytor har åtkomst och använder knappen Tilldela till arbetsytor för att lägga till dessa arbetsytor. Den aktuella arbetsytan måste inkluderas.
När du har tilldelat en arbetsyta kan du ändra standardåtkomstnivån läs- och skrivskyddad till Skrivskyddad: välj arbetsytan i listan och klicka på knappen Hantera åtkomstnivå .
Mer information finns i Begränsa katalogåtkomst till specifika arbetsytor.
Klicka på Nästa för att tilldela behörigheter för katalogen.
Alla kontoanvändare har
BROWSE
som standard behörighet, vilket ger dem möjlighet att identifiera katalogmetadata utan att ha läsåtkomst till data.Om du vill ge en användare, grupp eller tjänstens huvudnamn behörighet klickar du på Bevilja och följer anvisningarna i Behörigheter och skyddsbara objekt i Unity Catalog.
Klicka på Nästa för att lägga till valfri tagg och kommentera metadata.
Taggar är nyckel/värde-par som du kan använda för att organisera och kategorisera kataloger för att förenkla sökning och identifiering av dina datatillgångar. Värden är valfria. Se Tillämpa taggar på skyddsbara objekt i Unity Catalog.
En kommentar är ett öppet fält som ofta används för att ge en beskrivning som hjälper användarna att identifiera datatillgångarna i katalogen. Se Lägga till kommentarer till data och AI-tillgångar.
Klicka på Spara.
Lägg till scheman och dataobjekt i katalogen.
Se Skapa scheman.
Du kan använda Katalogutforskaren för att uppdatera ägare, taggar, kommentarer, arbetsytebindningar och behörigheter när som helst när du har skapat katalogen.
SQL
Om du vill skapa en standardkatalog kör du följande SQL-kommando i en notebook- eller SQL-frågeredigerare. Objekt inom hakparenteser är valfria. Ersätt platshållarvärdena:
<catalog-name>
: Ett namn på katalogen.<location-path>
: Valfritt men starkt rekommenderat. Ange en lagringsplatssökväg om du vill att hanterade tabeller i den här katalogen ska lagras på en annan plats än standardrotlagringen som konfigurerats för metaarkivet.Viktigt!
Om din arbetsyta inte har någon lagringsplats på metaarkivnivå måste du ange en hanterad lagringsplats när du skapar en katalog.
Den här sökvägen måste definieras i en extern platskonfiguration och du måste ha behörighet för konfigurationen
CREATE MANAGED STORAGE
av den externa platsen. Du kan använda sökvägen som definieras i konfigurationen av den externa platsen eller en undersökväg (med andra ord eller'abfss://my-container-name@storage-account-name.dfs.core.windows.net/finance'
'abfss://my-container-name@storage-account-name.dfs.core.windows.net/finance/product'
).<comment>
: Valfri beskrivning eller annan kommentar.
CREATE CATALOG [ IF NOT EXISTS ] <catalog-name>
[ MANAGED LOCATION '<location-path>' ]
[ COMMENT <comment> ];
Om du till exempel vill skapa en katalog med namnet example
:
CREATE CATALOG IF NOT EXISTS example;
Om du vill skapa en delad katalog kör du följande kommando i en notebook- eller SQL-frågeredigerare. Objekt inom hakparenteser är valfria.
CREATE CATALOG [IF NOT EXISTS] <catalog-name>
USING SHARE <provider-name>.<share-name>;
[ COMMENT <comment> ];
Om du vill skapa en sekundär katalog kör du följande kommando i en notebook- eller SQL-frågeredigerare. Objekt inom hakparenteser är valfria. Ersätt platshållarvärdena:
-
<catalog-name>
: Namn på katalogen i Azure Databricks. -
<connection-name>
: Anslutningsobjektet som anger autentiseringsuppgifterna för datakälla, sökväg och åtkomst. -
<database-name>
: Namnet på den databas som du vill spegla som en katalog i Azure Databricks. Krävs inte för MySQL, som använder ett namnområde med två lager. Använd i stället för Databricks-to-Databricks Lakehouse Federationcatalog '<external-catalog-name>'
. -
<external-catalog-name>
: Endast Databricks-to-Databricks : Namnet på katalogen på den externa Databricks-arbetsytan som du speglar. Se Köra federerade frågor på en annan Databricks-arbetsyta.
CREATE FOREIGN CATALOG [IF NOT EXISTS] <catalog-name> USING CONNECTION <connection-name>
OPTIONS [(database '<database-name>') | (catalog '<external-catalog-name>')];
Se även Skapa en sekundär katalog.
Om du vill begränsa katalogåtkomsten till specifika arbetsytor i ditt konto, även kallat bindning av arbetsytekataloger, kan du läsa Begränsa katalogåtkomsten till specifika arbetsytor.
Detaljerade parameterbeskrivningarfinns i CREATE CATALOG.
När du har skapat katalogen tilldelar du behörigheter till katalogen. Se Behörigheter och skyddsbara objekt i Unity Catalog.
Övrigt
Terraform: Du kan skapa en katalog med databricks Terraform-providern och databricks_catalog. Du kan hämta information om kataloger med hjälp av databricks_catalogs.
REST API: Använd POST /api/2.1/unity-catalog/catalogs.
Databricks CLI: databricks catalogs create <catalog-name> [options]
Om du vill ha en lista över alternativ kör du databricks catalogs create -h
. Alternativen beskrivs också i API-referensen. Följ API-länken i föregående stycke.
När du har skapat katalogen tilldelar du behörigheter till katalogen. Se Behörigheter och skyddsbara objekt i Unity Catalog.