Verwalten des Zugriffs auf Cloudspeicher mithilfe des Unity-Katalogs
Dieser Artikel bietet eine Übersicht über die Verwendung des Unity-Katalogs zum Verwalten des Zugriffs auf Cloudspeicher von Azure Databricks. Es führt die Konzepte des externen Speicherorts, der Speicheranmeldeinformationen und des verwalteten Speichers ein.
Hinweis
Wenn Sie den Unity-Katalog verwenden möchten, um den Zugriff auf einen externen Dienst anstelle von Cloudspeicher zu steuern, lesen Sie " Verwalten des Zugriffs auf externe Clouddienste mithilfe von Dienstanmeldeinformationen".
Externe Speicherorte und Speicheranmeldeinformationen
Alle Daten, die vom Unity-Katalog gesteuert werden, müssen in Ihrem Cloudanbieterkonto im Cloudspeicher gespeichert sein. Unity Catalog steuert den Zugriff auf Cloudspeicher mithilfe eines sicherungsfähigen Objekts, das als externer Speicherort bezeichnet wird, der einen Pfad zu einem Cloudspeicherort und die anmeldeinformationen definiert, die für den Zugriff auf diesen Standort erforderlich sind. Diese Anmeldeinformationen werden wiederum in einem sicherungsfähigen Unity-Katalogobjekt definiert, das als Speicheranmeldeinformationen bezeichnet wird. Indem Sie den Zugriff auf sicherungsfähige externe Standorte im Unity-Katalog gewähren und widerrufen, steuern Sie den Zugriff auf die Daten am Cloudspeicherort. Indem Sie den Zugriff auf Speicheranmeldeinformationen im Unity-Katalog gewähren und widerrufen, steuern Sie die Möglichkeit, externe Speicherortobjekte zu erstellen.
Hier ist ein wenig mehr Details zu diesen beiden sicherungsfähigen Objekten:
- Eine Speicheranmeldeinformation stellt einen Authentifizierungs- und Autorisierungsmechanismus für den Zugriff auf Daten dar, die auf Ihrem Cloudmandanten gespeichert sind, mithilfe einer von Azure verwalteten Identität oder einem Dienstprinzipal für Azure Data Lake Storage Gen2-Container oder einem R2-API-Token für Cloudflare R2-Buckets. Berechtigungen, die im Unity-Katalog gewährt werden, steuern, welche Benutzer und Gruppen die Anmeldeinformationen verwenden können, um externe Speicherorte zu definieren. Berechtigungen zum Erstellen und Verwenden von Speicheranmeldeinformationen sollten nur Benutzern erteilt werden, die externe Speicherortobjekte erstellen müssen. Weitere Informationen finden Sie unter Erstellen von Speicheranmeldeinformationen zum Herstellen einer Verbindung mit Azure Data Lake Storage Gen2 und Erstellen von Speicheranmeldeinformationen zum Herstellen einer Verbindung mit Cloudflare R2.
- Ein externer Speicherort kombiniert einen Cloudspeicherpfad mit einer Speicheranmeldeinformation, die den Zugriff auf den Cloudspeicherpfad autorisiert. Berechtigungen, die im Unity-Katalog gewährt werden, steuern, welche Benutzer und Gruppen auf den vom externen Speicherort definierten Cloudspeicherpfad zugreifen können. Die Berechtigung zum Erstellen und Verwenden externer Speicherorte sollte nur Benutzer*innen gewährt werden, die externe Tabellen, externe Volumes oder verwaltete Speicherorte erstellen müssen. Weitere Informationen finden Sie unter Erstellen eines externen Speicherorts zum Verbinden des Cloudspeichers mit Azure Databricks.
Externe Speicherorte werden im Unity-Katalog sowohl für externe Datenressourcen wie externe Tabellen und externe Volumes als auch für verwaltete Datenressourcen wie verwaltete Tabellen und verwaltete Volumes verwendet. Weitere Informationen zum Unterschied zwischen externen und verwalteten Datenressourcen im Unity-Katalog finden Sie unter Was sind Tabellen und Ansichten? Und was sind Unity-Katalogvolumes?.
Informationen zu bewährten Methoden für die Verwendung externer Speicherorte finden Sie unter Verwalten externer Speicherorte, externer Tabellen und externer Volumes.
Verwenden externer Speicherorte beim Erstellen externer Tabellen und Volumes
Externe Tabellen und externe Volumes, die im Unity-Katalog registriert sind, sind im Wesentlichen Zeiger auf Daten im Cloudspeicher, die Sie außerhalb von Azure Databricks verwalten. Wenn Sie eine externe Tabelle oder ein externes Volume im Unity-Katalog erstellen, müssen Sie auf einen Cloudspeicherpfad verweisen, der in einem externen Standortobjekt enthalten ist, für das Ihnen ausreichende Berechtigungen gewährt wurden. Weitere Informationen zum Unterschied zwischen externen und verwalteten Datenressourcen im Unity-Katalog finden Sie unter Was sind Tabellen und Ansichten? Und was sind Unity-Katalogvolumes?. Berechtigungen finden Sie unter Erteilen von Berechtigungen an einem externen Speicherort.
Verwenden externer Speicherorte beim Erstellen von verwaltetem Speicher
Verwaltete Tabellen und verwaltete Volumes werden vollständig vom Unity-Katalog verwaltet. Sie werden standardmäßig an einem verwalteten Speicherort gespeichert, der auf Metastore-, Katalog- oder Schemaebene definiert werden kann. Wenn Sie einem Metastore, Katalog oder Schema einen verwalteten Speicherort zuweisen, müssen Sie auf ein externes Speicherortobjekt verweisen und über ausreichende Berechtigungen verfügen, um ihn zu verwenden. Weitere Informationen finden Sie unter Angeben eines verwalteten Speicherorts in Unity Catalog und Bewährte Methoden für Unity Catalog.
Workflow zum Verwalten des Zugriffs auf Cloudspeicher im Unity-Katalog
Um den Zugriff auf Cloudspeicher mithilfe des Unity-Katalogs zu verwalten, gehen Sie wie folgt vor:
- Erstellen Sie ein Speicheranmeldeinformationsobjekt, das eine von Azure verwaltete Identität kapselt, die Zugriff auf den Cloudspeicherpfad gewährt.
- Erstellen Sie ein externes Speicherortobjekt, das auf den Speicherpfad und das Speicheranmeldeinformationsobjekt verweist.
- Verweisen Sie auf einen Pfad, der am externen Speicherort enthalten ist, wenn Sie externe Tabellen, externe Volumes oder standardverwaltete Speicherorte erstellen. Dies kann der genaue Pfad sein, der an der externen Position oder einem Unterpfad definiert ist.
Nächste Schritte
- Erstellen einer Speicheranmeldeinformation zum Herstellen einer Verbindung mit Azure Data Lake Storage Gen2
- Erstellen einer Speicheranmeldeinformation zum Herstellen einer Verbindung mit Cloudflare R2
- Erstellen eines externen Speicherorts zum Verbinden des Cloudspeichers mit Azure Databricks
- Angeben eines verwalteten Speicherorts im Unity-Katalog
- Verwalten von Speicheranmeldeinformationen
- Verwalten externer Speicherorte