Erstellen von Katalogen
In diesem Artikel erfahren Sie, wie Sie Kataloge in Unity Catalog erstellen. Ein Katalog enthält Schemata (Datenbanken) und ein Schema Tabellen, Ansichten, Datenträger, Modelle und Funktionen.
Weitere Informationen zu Katalogen finden Sie unter Was sind Kataloge in Azure Databricks?.
Hinweis
Informationen zum Erstellen eines Fremdkatalogs, eines Unity Catalog-Objekts, das eine Datenbank in einem externen Datensystem spiegelt, finden Sie unter Erstellen eines Fremdkatalogs. Weitere Informationen finden Sie außerdem unter Verwalten und Arbeiten mit Fremdkatalogen.
Anforderungen
So erstellen Sie unabhängig vom Katalogtyp einen Katalog
- Sie müssen ein Azure Databricks-Metastore-Administrator sein oder über die
CREATE CATALOG
-Berechtigung für den Metastore verfügen. - Die Computeressource, die Sie zum Ausführen eines Notebooks zum Erstellen eines Katalogs verwenden, muss in Databricks Runtime 11.3 oder höher ausgeführt werden und einen Unity Catalog-konformen Zugriffsmodus verwenden. Weitere Informationen finden Sie unter Zugriffsmodi. SQL-Warehouses unterstützen Unity Catalog immer.
So erstellen Sie einen freigegebenen Katalog
- Die Delta Sharing-Freigabe muss bereits in Ihrem Arbeitsbereich vorhanden sein. Weitere Informationen finden Sie unter Wie stelle ich meinem Team freigegebene Daten zur Verfügung?.
- Sie müssen Metastoreadministrator sein, über die
USE PROVIDER
-Berechtigung verfügen oder Besitzer des Anbieterobjekts sein, das die Freigabe enthält.
So erstellen Sie einen Standardkatalog
- Wenn Sie einen verwalteten Speicherort für den Katalog angeben, müssen Sie über die Berechtigung
CREATE MANAGED STORAGE
für den externen Zielspeicherort verfügen. - Wenn kein verwalteter Speicher auf Metastoreebene vorhanden ist, müssen Sie einen verwalteten Speicherort für den Katalog angeben.
So erstellen Sie einen Fremdkatalog
- Sie müssen Besitzer der Verbindung sein, die Sie zum Erstellen des Fremdkatalogs verwenden, oder über die Berechtigung
CREATE FOREIGN CATALOG
für die Verbindung verfügen. - Sie müssen Compute in Databricks Runtime 13.1 oder höher verwenden. SQL-Warehouses müssen „Pro“ oder serverlos sein.
Erstellen eines Katalogs
Zum Erstellen eines Katalogs können Sie den Katalog-Explorer, einen SQL-Befehl, die REST-API, die Databricks CLI oder Terraform verwenden. Wenn Sie einen Katalog erstellen, werden automatisch zwei Schemas (Datenbanken) erstellt: default
und information_schema
.
Katalog-Explorer
Melden Sie sich bei einem Arbeitsbereich an, der mit dem Metastore verknüpft ist.
Wählen Sie Katalog aus.
Klicken Sie auf die Schaltfläche Katalog erstellen.
Geben Sie im Dialogfeld Neuen Katalog erstellen einen Katalognamen ein, und wählen Sie den Typ des Katalogs aus, den Sie erstellen möchten:
- Standardkatalog: ein sicherungsfähiges Objekt, das Daten- und KI-Ressourcen organisiert, die von Unity Catalog verwaltet werden. Für alle Anwendungsfälle außer Lakehouse-Verbund und Katalogen, die auf der Grundlage von Delta Sharing-Freigaben erstellt wurden.
- Fremdkatalog: ein sicherungsfähiges Objekt, das eine Datenbank in einem externen Datensystem mithilfe von Lakehouse-Verbund spiegelt. Weitere Informationen finden Sie unter Übersicht über die Einrichtung von Lakehouse Federation.
- Freigegebener Katalog: ein sicherungsfähiges Objekt, das Daten und andere Objekte organisiert, die für Sie als Delta Sharing-Freigabe freigegeben werden. Durch das Erstellen eines Katalogs auf der Grundlage einer Freigabe werden diese Ressourcen Benutzern in Ihrem Arbeitsbereich zum Lesen verfügbar gemacht. Weitere Informationen finden Sie unter Was ist eine Freigabe?.
Geben Sie je nach Katalogtyp die folgenden Optionen an:
Bei Standardkatalogen: Es ist optional, wird aber dringend empfohlen, einen verwalteten Speicherort anzugeben. Sie müssen über die Berechtigung
CREATE MANAGED STORAGE
für den externen Zielspeicherort verfügen, den Sie als verwalteten Speicherort verwenden. Weitere Informationen finden Sie unter Angeben eines verwalteten Speicherorts in Unity Catalog.Optional können Sie einen Unterpfad eines definierten externen Speicherorts angeben. Wenn Sie keinen externen Speicherort definiert haben, können Sie einen erstellen, indem Sie auf Neuen externen Speicherort erstellen klicken.
Wichtig
Wenn Ihr Arbeitsbereich keinen Speicherort auf Metastore-Ebene aufweist, müssen Sie beim Erstellen eines Katalogs einen verwalteten Speicherort angeben.
Bei Fremdkatalogen: Sie müssen eine Verbindung auswählen, bei der es sich um ein sicherungsfähiges Objekt in Unity Catalog handelt, das einen Pfad und Anmeldeinformationen für den Zugriff auf ein externes Datenbanksystem angibt. Weitere Informationen finden Sie unter Übersicht über die Einrichtung von Lakehouse Federation.
Wenn Sie die Verbindung ausgewählt haben, geben Sie den Namen der Datenbank oder eines anderen Databricks-Katalogs ein, die bzw. den Sie spiegeln möchten.
Die Anforderungen variieren je nach Datenquelle:
- MySQL verwendet einen Namespace mit zwei Ebenen und erfordert daher keinen Datenbanknamen.
- Geben Sie für Verbindungen mit einem Katalog in einem anderen Databricks-Arbeitsbereich den Databricks-Katalognamen anstelle eines Datenbanknamens ein.
Wenn Sie keine Verbindung definiert haben, können Sie eine erstellen, indem Sie auf Neue Verbindung erstellen klicken.
Bei freigegebenen Katalogen: Sie müssen einen Anbieter und eine Freigabe auswählen. Nachdem Sie den Anbieter ausgewählt haben, können Sie eine der Freigaben des Anbieters auswählen.
Wenn Sie nicht sicher sind, welchen Anbieter und welche Freigabe Sie verwenden möchten, ist es vielleicht einfacher, über den Katalog-Explorer nach Anbietern und Freigaben zu suchen. Weitere Informationen finden Sie unter Anzeigen von Anbietern und Anzeigen von Freigaben, die ein Anbieter für Sie freigegeben hat.
Klicken Sie auf Erstellen.
Klicken Sie im Dialogfeld Katalog erstellt! auf Katalog anzeigen, um den Katalog als automatisch konfiguriert zu akzeptieren. Oder klicken Sie auf Katalog konfigurieren (empfohlen), um Katalogberechtigungen, Arbeitsbereichsbindungen und Metadaten zu konfigurieren.
Wenn Sie auf Katalog anzeigen klicken, ist der Katalog für alle Arbeitsbereiche zugänglich, die an den Metastore angefügt sind, und allen Kontobenutzern wird die Berechtigung
BROWSE
gewährt. Sie können die restlichen Schritte in diesem Verfahren überspringen und mit dem Hinzufügen von Schemas zum Katalog fortfahren. Weitere Informationen finden Sie unter Erstellen von Schemas.Sie können jederzeit zur Katalogdetailseite im Katalog-Explorer zurückkehren, um den Besitzer, Tags, Kommentare, Arbeitsbereichsbindungen, Berechtigungen und Schemas zu aktualisieren.
Geben Sie auf der Seite Katalog konfigurieren > Arbeitsbereiche den Arbeitsbereich an, an den der Katalog gebunden ist.
Standardmäßig wird der Katalog für alle Arbeitsbereiche freigegeben, die an den aktuellen Metastore angefügt sind. Wenn der Katalog Daten enthält, die auf bestimmte Arbeitsbereiche beschränkt werden sollen, deaktivieren Sie die Option Alle Arbeitsbereiche haben Zugriff, und verwenden Sie die Schaltfläche Arbeitsbereichen zuweisen, um diese Arbeitsbereiche hinzuzufügen. Der aktuelle Arbeitsbereich muss enthalten sein.
Nachdem Sie einen Arbeitsbereich zugewiesen haben, können Sie optional die Standardzugriffsebene Lesen und schreiben in Schreibgeschützt ändern: Wählen Sie den Arbeitsbereich in der Liste aus, und klicken Sie auf die Schaltfläche Zugriffsebene verwalten.
Weitere Informationen finden Sie unter Einschränken des Katalogzugriffs auf bestimmte Arbeitsbereiche.
Klicken Sie auf Weiter, um Berechtigungen für Ihren Katalog zuzuweisen.
Alle Kontobenutzer verfügen standardmäßig über die Berechtigung
BROWSE
, sodass sie Katalogmetadaten entdecken können, ohne Lesezugriff auf die Daten zu haben.Um einem Benutzer, einer Gruppe oder einem Dienstprinzipal eine Berechtigung zu gewähren, klicken Sie auf Erteilen, und befolgen Sie den Anweisungen unter Unity Catalog-Berechtigungen und sicherungsfähige Objekte.
Klicken Sie auf Weiter, um optionale Metadaten für Tags und Kommentare hinzuzufügen.
Tags sind Schlüssel-Wert-Paare, mit denen Sie Kataloge organisieren und kategorisieren können, um die Suche und Ermittlung Ihrer Datenressourcen zu vereinfachen. Werte sind optional. Weitere Informationen finden Sie unter Anwenden von Tags auf sicherungsfähige Unity Catalog-Objekte.
Ein Kommentar ist ein offenes Feld, mit dem häufig eine Beschreibung angegeben wird, um Benutzern die Ermittlung der Datenressourcen im Katalog zu erleichtern. Weitere Informationen finden Sie unter Hinzufügen von Kommentaren zu Daten und KI-Ressourcen.
Klicken Sie auf Speichern.
Fügen Sie dem Katalog Schemas und Datenobjekte hinzu.
Weitere Informationen finden Sie unter Erstellen von Schemas.
Sie können jederzeit den Katalog-Explorer verwenden, um den Besitzer, Tags, Kommentare, Arbeitsbereichsbindungen und Berechtigungen zu aktualisieren, nachdem Sie den Katalog erstellt haben.
SQL
Führen Sie den folgenden SQL-Befehl in einem Notebook oder SQL-Abfrage-Editor aus, um einen Standardkatalog zu erstellen. Elemente in Klammern sind optional. Ersetzen Sie folgende Platzhalterwerte:
<catalog-name>
: Ein Name für den Katalog.<location-path>
: optional, jedoch dringend empfohlen. Geben Sie einen Speicherpfad an, wenn Sie möchten, dass verwaltete Tabellen in diesem Katalog an einem anderen Ort als dem für den Metaspeicher konfigurierten Standard-Stammspeicher gespeichert werden.Wichtig
Wenn Ihr Arbeitsbereich keinen Speicherort auf Metastore-Ebene aufweist, müssen Sie beim Erstellen eines Katalogs einen verwalteten Speicherort angeben.
Der Pfad muss in einer Konfiguration mit einem externen Speicherort definiert werden, und Sie müssen über die
CREATE MANAGED STORAGE
Berechtigung für die Konfiguration des externen Speicherorts verfügen. Sie können den Pfad verwenden, der in der Konfiguration des externen Speicherorts definiert ist, oder einen Unterpfad (mit anderen Worten,'abfss://my-container-name@storage-account-name.dfs.core.windows.net/finance'
oder'abfss://my-container-name@storage-account-name.dfs.core.windows.net/finance/product'
).<comment>
: Optionale Beschreibung oder anderer Kommentar.
CREATE CATALOG [ IF NOT EXISTS ] <catalog-name>
[ MANAGED LOCATION '<location-path>' ]
[ COMMENT <comment> ];
So erstellen Sie beispielsweise einen Katalog mit dem Namen example
:
CREATE CATALOG IF NOT EXISTS example;
Führen Sie den folgenden Befehl in einem Notebook oder SQL-Abfrage-Editor aus, um einen freigegebenen Katalog zu erstellen. Elemente in Klammern sind optional.
CREATE CATALOG [IF NOT EXISTS] <catalog-name>
USING SHARE <provider-name>.<share-name>;
[ COMMENT <comment> ];
Führen Sie den folgenden Befehl in einem Notebook oder SQL-Abfrage-Editor aus, um einen Fremdkatalog zu erstellen. Elemente in Klammern sind optional. Ersetzen Sie folgende Platzhalterwerte:
<catalog-name>
: Name für den Katalog in Azure Databricks.<connection-name>
: Das Verbindungsobjekt, das die Datenquelle, den Pfad und die Anmeldeinformationen für den Zugriff angibt.<database-name>
: Name der Datenbank, die sie als Katalog in Azure Databricks spiegeln möchten. Nicht erforderlich für MySQL, das einen Namespace mit zwei Ebenen verwendet. Verwenden Sie für einen Lakehouse-Verbund von Databricks-zu-Databricks stattdessencatalog '<external-catalog-name>'
.<external-catalog-name>
: Databricks zu Databricks: Name des Katalogs im externen Databricks-Arbeitsbereich, den Sie spiegeln. Weitere Informationen finden Sie unter Ausführen von Verbundabfragen für einen anderen Databricks-Arbeitsbereich.
CREATE FOREIGN CATALOG [IF NOT EXISTS] <catalog-name> USING CONNECTION <connection-name>
OPTIONS [(database '<database-name>') | (catalog '<external-catalog-name>')];
Lesen Sie außerdem die Informationen unter Erstellen eines Fremdkatalogs.
Wenn Sie den Katalogzugriff auf bestimmte Arbeitsbereiche in Ihrem Konto einschränken möchten (auch als Arbeitsbereichskatalogbindung bezeichnet), helfen Ihnen die Informationen unter Einschränken des Katalogzugriffs auf bestimmte Arbeitsbereiche weiter.
Ausführliche Parameterbeschreibungen finden Sie unter CREATE CATALOG.
Nachdem Sie den Katalog erstellt haben, weisen Sie dem Katalog Berechtigungen zu. Weitere Informationen finden Sie unter Unity Catalog-Berechtigungen und sicherungsfähige Objekte.
Andere
Terraform: Sie können einen Katalog erstellen, indem Sie den Databricks Terraform-Anbieter und databricks_catalog verwenden. Sie können Informationen über Kataloge mithilfe von databricks_catalogs abrufen.
REST-API: Verwenden Sie POST /api/2.1/unity-catalog/catalogs.
Databricks CLI: databricks catalogs create <catalog-name> [options]
Führen Sie databricks catalogs create -h
aus, um eine Liste der Optionen anzuzeigen. Optionen werden auch in der API-Referenz beschrieben. Klicken Sie auf den API-Link im vorherigen Absatz.
Nachdem Sie den Katalog erstellt haben, weisen Sie dem Katalog Berechtigungen zu. Weitere Informationen finden Sie unter Unity Catalog-Berechtigungen und sicherungsfähige Objekte.