Freigeben über


Arbeitsbereichsbibliotheken (Legacy)

Wichtig

Diese Dokumentation wurde eingestellt und wird unter Umständen nicht aktualisiert. Die in diesem Inhalt erwähnten Produkte, Dienste oder Technologien werden nicht mehr unterstützt. Weitere Informationen finden Sie unter Clusterbibliotheken.

Hinweis

Arbeitsbereichsbibliotheken sind veraltet und sollten nicht genutzt werden. Das Speichern von Bibliotheken als Arbeitsbereichsdateien von Arbeitsbereichsbibliotheken unterscheidet sich jedoch und wird weiterhin vollständig unterstützt. Sie können Bibliotheken, die als Arbeitsbereichsdateien gespeichert sind, direkt installieren, um Aufgaben zu berechnen oder zu erledigen.

Arbeitsbereichsbibliotheken dienen als lokales Repository, über das Sie per Cluster installierte Bibliotheken erstellen können. Bei einer Arbeitsbereichsbibliothek kann es sich beispielsweise um benutzerdefinierten Code handeln, der von Ihrer Organisation erstellt wurde, oder um eine bestimmte Version einer Open-Source-Bibliothek, die in Ihrer Organisation als Standard etabliert wurde.

Sie müssen eine Arbeitsbereichsbibliothek in einem Cluster installieren, bevor sie in einem Notebook oder Auftrag verwendet werden kann. Weitere Informationen finden Sie unter Installieren einer Arbeitsbereichsbibliothek in einem Cluster.

Arbeitsbereichsbibliotheken im Ordner „Freigegeben“ sind für alle Benutzer in einem Arbeitsbereich verfügbar, während Arbeitsbereichsbibliotheken in einem Benutzerordner nur für diesen Benutzer verfügbar sind.

Wichtig

Bei Verwendung von Databricks Runtime 14.3 LTS und niedriger können Bibliotheken über DBFS installiert werden. Arbeitsbereichsbenutzer und -benutzerinnen können jedoch Bibliotheksdateien ändern, die in DBFS gespeichert sind. Um die Sicherheit von Bibliotheken in einem Azure Databricks-Arbeitsbereich zu verbessern, wurde das Speichern von Bibliotheksdateien im DBFS-Stamm eingestellt und ist in Databricks Runtime 15.1 und höher standardmäßig deaktiviert. Weitere Informationen finden Sie unter Das Speichern von Bibliotheken im DBFS-Stamm ist veraltet und standardmäßig deaktiviert.

Stattdessen empfiehlt Databricks, alle Bibliotheken (einschließlich Python-Bibliotheken, JAR-Dateien und Spark-Connectors) in Arbeitsbereichsdateien oder auf Unity Catalog-Volumes hochzuladen oder Bibliothekspaketrepositorys zu verwenden. Wenn Ihre Workload diese Muster nicht unterstützt, können Sie auch Bibliotheken verwenden, die im Cloudobjektspeicher gespeichert sind.

Wie unterscheiden sich Arbeitsbereichsbibliotheken von Bibliotheken, die mit Arbeitsbereichsdateien gespeichert sind?

Der Begriff „Arbeitsbereichsbibliotheken“ bezieht sich auf jede Bibliothek, die in einem Arbeitsbereich registriert ist. Arbeitsbereichsbibliotheken werden zusammen mit Notebooks und Arbeitsbereichsdateien angezeigt und befolgen die ACL-Regeln für das enthaltende Verzeichnis.

Der Begriff „Arbeitsbereichsdateien“ bezieht sich auf alle Dateien, die im Arbeitsbereich gespeichert sind. Sie können Python-.whl-Pakete als Arbeitsbereichsdateien speichern und dann als Arbeitsbereichsbibliotheken registrieren. Weitere Informationen finden Sie unter Was sind Arbeitsbereichsdateien?.

Sie können Bibliotheken als Arbeitsbereichsdateien hochladen. Weitere Informationen finden Sie unter Grundlegende Verwendung von Arbeitsbereichsdateien.

Sie können zwar viele Dateitypen in Arbeitsbereichsdateien hochladen, aber nur Python-.whl-Dateien können über Arbeitsbereichsdateien installiert werden. Siehe Bibliotheken im Clusterbereich.

In Databricks Runtime 13.3 LTS und höher können Sie %pip verwenden, um Python-Wheel-Dateien zu installieren, die als Arbeitsbereichsdateien gespeichert sind. Weitere Informationen finden Sie unter Installieren eines als Arbeitsbereichsdatei gespeicherten Pakets mit %pip.

Erstellen einer Arbeitsbereichsbibliothek

Warnung

Diese Funktionalität ist nicht mehr verfügbar. Weitere Informationen finden Sie unter Erstellung und Installation von Arbeitsbereichsbibliotheken ist nicht mehr verfügbar.

  1. Klicken Sie mit der rechten Maustaste auf den Arbeitsbereichsordner, in dem Sie die Bibliothek speichern möchten.
  2. Klicken Sie auf Bibliothek > erstellen. Das Dialogfeld „Bibliothek erstellen“ wird angezeigt.
  3. Wählen Sie die Bibliotheksquelle aus und führen Sie das entsprechende Verfahren aus:

Hochladen einer JAR-, Python Egg- oder Python Wheel-Datei

Hinweis

Die Installation von Python-Egg-Dateien ist veraltet und wird in einer zukünftigen Databricks Runtime-Version entfernt.

Wichtig

Bei Verwendung von Databricks Runtime 14.3 LTS und niedriger können Bibliotheken über DBFS installiert werden. Arbeitsbereichsbenutzer und -benutzerinnen können jedoch Bibliotheksdateien ändern, die in DBFS gespeichert sind. Um die Sicherheit von Bibliotheken in einem Azure Databricks-Arbeitsbereich zu verbessern, wurde das Speichern von Bibliotheksdateien im DBFS-Stamm eingestellt und ist in Databricks Runtime 15.1 und höher standardmäßig deaktiviert. Weitere Informationen finden Sie unter Das Speichern von Bibliotheken im DBFS-Stamm ist veraltet und standardmäßig deaktiviert.

Stattdessen empfiehlt Databricks, alle Bibliotheken (einschließlich Python-Bibliotheken, JAR-Dateien und Spark-Connectors) in Arbeitsbereichsdateien oder auf Unity Catalog-Volumes hochzuladen oder Bibliothekspaketrepositorys zu verwenden. Wenn Ihre Workload diese Muster nicht unterstützt, können Sie auch Bibliotheken verwenden, die im Cloudobjektspeicher gespeichert sind.

  1. Wählen Sie in der Schaltflächenliste „Bibliotheksquelle“ die OptionHochladen aus.
  2. Wählen Sie Jar, Python Egg oder Python Whl aus.
  3. Geben Sie optional einen Bibliotheksnamen ein.
  4. Ziehen Sie Ihre Jar-, Egg- oder Whl-Datei in das Dropdownfeld oder klicken Sie auf das Dropdownfeld und navigieren Sie zu einer Datei. Die Datei wird nach dbfs:/FileStore/jars hochgeladen.
  5. Klicken Sie auf Erstellen. Der Bildschirm mit dem Bibliotheksstatus wird angezeigt.

Verweisen auf eine hochgeladene JAR-, Python Egg- oder Python-Wheel-Datei

Sie können eine neue Arbeitsbereichsbibliothek erstellen, indem Sie auf JAR-, Python Egg- oder Python Wheel-Dateien verweisen, die im DBFS-Stamm, im Objektspeicher oder zusammen mit Arbeitsbereichsdateien gespeichert sind. Nach diesem Workflow wird ein Zeiger auf eine Bibliothek registriert, ohne Dateien hochzuladen oder zu verschieben.

Mit Databricks Runtime 13.2 und höher können Sie auch auf ein Volume in Unity Catalog verweisen. Diese Funktion ist in Public Preview.

Für den Zugriffsmodus „Freigegeben“ müssen Sie JARs zu allowlist hinzufügen. Weitere Informationen finden Sie unter Positivliste von Bibliotheken und Initialisierungsskripts auf freigegebenem Compute.

  1. Wählen Sie in der Schaltflächenliste „Bibliotheksquelle“ die Option Dateipfad/ADLS aus.
  2. Wählen Sie Jar, Python Egg oder Python Whl aus.
  3. Geben Sie optional einen Bibliotheksnamen ein.
  4. Geben Sie den Pfad zur Bibliothek wie in den folgenden Beispielen an:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Klicken Sie auf Erstellen. Der Bildschirm mit dem Bibliotheksstatus wird angezeigt.

Weitere Informationen zum Arbeiten mit Bibliotheken im Objektspeicher finden Sie unter Installieren von Bibliotheken aus dem Objektspeicher.

Weitere Informationen zu Arbeitsbereichsdateien finden Sie unter Arbeiten mit Dateien in Azure Databricks.

Installieren einer Arbeitsbereichsbibliothek in einem Cluster

Hinweis

Azure Databricks verarbeitet alle Arbeitsbereichsbibliotheken in der Reihenfolge, in der sie im Cluster installiert wurden. Möglicherweise müssen Sie auf die Reihenfolge der Installation im Cluster achten, wenn Abhängigkeiten zwischen Bibliotheken vorhanden sind.

Wichtig

Bei Verwendung von Databricks Runtime 14.3 LTS und niedriger können Bibliotheken über DBFS installiert werden. Arbeitsbereichsbenutzer und -benutzerinnen können jedoch Bibliotheksdateien ändern, die in DBFS gespeichert sind. Um die Sicherheit von Bibliotheken in einem Azure Databricks-Arbeitsbereich zu verbessern, wurde das Speichern von Bibliotheksdateien im DBFS-Stamm eingestellt und ist in Databricks Runtime 15.1 und höher standardmäßig deaktiviert. Weitere Informationen finden Sie unter Das Speichern von Bibliotheken im DBFS-Stamm ist veraltet und standardmäßig deaktiviert.

Stattdessen empfiehlt Databricks, alle Bibliotheken (einschließlich Python-Bibliotheken, JAR-Dateien und Spark-Connectors) in Arbeitsbereichsdateien oder auf Unity Catalog-Volumes hochzuladen oder Bibliothekspaketrepositorys zu verwenden. Wenn Ihre Workload diese Muster nicht unterstützt, können Sie auch Bibliotheken verwenden, die im Cloudobjektspeicher gespeichert sind.

Im Modus für den Einzelbenutzerzugriff wird die Identität des zugewiesenen Prinzipals (ein Benutzer oder Dienstprinzipal) verwendet. Im Zugriffsmodus „Freigegeben“ verwenden Bibliotheken die Identität des Benutzers, der die Bibliothek installiert hat. Der Zugriffsmodus „Freigegeben“ ohne Isolation unterstützt keine Volumes, verwendet jedoch die gleiche Identitätszuweisung wie der freigegebene Zugriffsmodus.

Alle Optionen zum Installieren von Bibliotheken auf Clustern finden Sie unter Clusterbibliotheken.

Um eine Bibliothek zu installieren, die bereits im Arbeitsbereich vorhanden ist, können Sie über die Clusterbenutzeroberfläche oder die Bibliotheksbenutzeroberfläche beginnen:

Cluster

  1. Klicken Sie auf der Seitenleiste auf Computesymbol Compute.
  2. Klicken Sie auf einen Clusternamen.
  3. Klicken Sie auf die Registerkarte Bibliotheken.
  4. Klicken Sie auf Neu installieren.
  5. Wählen Sie in der Schaltflächenliste „Bibliotheksquelle“ die Option Arbeitsbereichsbibliothek aus.
  6. Wählen Sie eine Arbeitsbereichsbibliothek aus.
  7. Klicken Sie auf Installieren.

Bibliothek

  1. Navigieren Sie zum Ordner mit der Bibliothek.
  2. Klicken Sie auf den Bibliotheksnamen.
  3. Aktivieren Sie das Kontrollkästchen neben dem Cluster, auf dem Sie die Bibliothek installieren möchten, und klicken Sie auf Installieren. In der Liste werden nur Cluster, die aktuell ausgeführt werden, angezeigt.

Details der Arbeitsbereichsbibliothek anzeigen

Hinweis

Arbeitsbereichsordner ermöglichen die einfache Ermittlung von Arbeitsbereichsbibliotheken und die Verwaltung von ACLs.

  1. Wechseln Sie zum Arbeitsbereichsordner, der die Bibliothek enthält.
  2. Klicken Sie auf den Bibliotheksnamen.

Auf der Detailseite der Bibliothek werden die ausgeführten Cluster und der Installationsstatus der Bibliothek angezeigt. Wenn die Bibliothek installiert ist, enthält die Seite einen Link zum Pakethost. Wenn die Bibliothek hochgeladen wurde, wird auf der Seite ein Link zur hochgeladenen Paketdatei angezeigt.

Verschieben einer Arbeitsbereichsbibliothek

Hinweis

Arbeitsbereichsordner ermöglichen die einfache Ermittlung von Arbeitsbereichsbibliotheken und die Verwaltung von ACLs. Beim Verschieben einer Arbeitsbereichsbibliothek werden keine Dateien verschoben, aber es kann sich ändern, welche Benutzer Zugriff auf die Arbeitsbereichsbibliothek haben.

  1. Wechseln Sie zum Arbeitsbereichsordner, der die Bibliothek enthält.
  2. Klicken Sie mit der rechten Maustaste auf den Bibliotheksnamen und wählen Sie Verschieben aus. Ein Ordnerbrowser wird angezeigt.
  3. Klicken Sie auf den Zielordner.
  4. Klicken Sie auf Move (Verschieben).

Löschen einer Arbeitsbereichsbibliothek

Wichtig

Vor dem Löschen einer Arbeitsbereichsbibliothek sollten Sie sie aus allen Clustern deinstallieren.

Löschen einer Arbeitsbereichsbibliothek:

  1. Verschieben Sie die Bibliothek in den Papierkorb.
  2. Löschen Sie entweder die Bibliothek dauerhaft aus dem Papierkorb oder leeren Sie den Papierkorb.