Installieren von Bibliotheken aus Arbeitsbereichsdateien
In diesem Artikel werden die erforderlichen Schritte zum Hochladen von Paketdateien oder Dateien vom Typ „requirements.txt“ in Arbeitsbereichsdateien und deren Installation in Clustern in Azure Databricks erläutert. Sie können Bibliotheken für „All-Purpose Compute“ oder „Jobs Compute“ installieren.
Wichtig
In diesem Artikel wird das Speichern von Bibliotheken als Arbeitsbereichsdateien beschrieben. Dies unterscheidet sich von Arbeitsbereichsbibliotheken, die eingestellt wurden.
Weitere Informationen zu Arbeitsbereichsdateien finden Sie unter Navigieren im Arbeitsbereich.
Databricks Runtime 15.0 oder höher ist erforderlich, um requirements.txt-Dateien in Arbeitsbereichsdateien hochzuladen. Ausführliche Informationen zur Kompatibilität der Bibliothek finden Sie unter Bibliotheken.
Laden von Bibliotheken in Arbeitsbereichsdateien
Sie können Bibliotheken auf die gleiche Weise in Arbeitsbereichsdateien laden, wie Sie andere Dateien laden.
So laden Sie eine Bibliothek in Arbeitsbereichsdateien:
- Klicken Sie in der linken Randleiste auf Workspace.
- Navigieren Sie zu dem Speicherort im Arbeitsbereich, in den Sie die Bibliothek hochladen möchten.
- Klicken Sie oben rechts auf das Optionsmenü , und wählen Sie Import aus.
- Das Dialogfeld Import wird angezeigt. Wählen Sie für Import from: (Importieren aus:) die Option File (Datei) oder URL aus. Wählen Sie die Dateien, die Sie hochladen möchten per Drag & Drop oder über die Suche aus, oder geben Sie den URL-Pfad zur Datei an.
- Klicken Sie auf Importieren.
Installieren von Bibliotheken aus Arbeitsbereichsdateien in einem Cluster
Wenn Sie eine Bibliothek in einem Cluster installieren, haben alle Notebooks, die auf diesem Cluster ausgeführt werden, Zugriff auf die Bibliothek.
So installieren Sie eine Bibliothek aus Arbeitsbereichsdateien in einem Cluster:
- Klicken Sie in der linken Randleiste auf Compute.
- Klicken Sie in der Clusterliste auf den Namen des Clusters.
- Klicken Sie auf die Registerkarte Bibliotheken.
- Klicken Sie auf Install new (Neu installieren). Das Dialogfeld Install library (Bibliothek installieren) wird angezeigt.
- Wählen Sie unter Library Source (Bibliotheksquelle) die Option Workspace (Arbeitsbereich) aus.
- Laden Sie die Bibliothek oder die Datei vom Typ „requirements.txt“ hoch, navigieren Sie zu der Bibliothek oder der Datei „requirements.txt“ im Arbeitsbereich, oder geben Sie ihren Arbeitsbereichsspeicherort im Feld Arbeitsbereichsdateipfad ein, z. B.
/Workspace/Users/someone@example.com/<path-to-library>/<library-name>.<ext>
. - Klicke auf Installieren.
Hinzufügen abhängiger Bibliotheken zu Workflowaufgaben aus Arbeitsbereichsdateien
Sie können abhängige Bibliotheken zu Aufgaben aus Arbeitsbereichsdateien hinzufügen. Siehe Konfigurieren und Bearbeiten von Databricks-Aufgaben.
So konfigurieren Sie eine Workflowaufgabe mit einer abhängigen Bibliothek aus Arbeitsbereichsdateien:
- Wählen Sie eine vorhandene Aufgabe in einem Workflow aus, oder erstellen Sie eine neue Aufgabe.
- Klicken Sie neben Abhängige Bibliotheken auf + Hinzufügen.
- Wählen Sie im Dialogfeld Add dependent library (Abhängige Bibliothek hinzufügen) die Option Workspace (Arbeitsbereich) unter Library Source (Bibliotheksquelle) aus.
- Laden Sie die Bibliothek oder die Datei vom Typ „requirements.txt“ hoch, navigieren Sie zu der Bibliothek oder der Datei „requirements.txt „ im Arbeitsbereich, oder geben Sie ihren Arbeitsbereichsspeicherort im Feld Arbeitsbereichsdateipfad ein, z. B.
/Workspace/Users/someone@example.com/<path-to-library>/<library-name>.<ext>
. - Klicke auf Installieren.
Installieren von Bibliotheken aus Arbeitsbereichsdateien in einem Notebook
Sie können Python-Bibliotheken direkt in einem Notebook installieren, um benutzerdefinierte Umgebungen zu erstellen, die für das Notebook spezifisch sind. Beispielsweise können Sie eine bestimmte Version einer Bibliothek in einem Notebook verwenden, ohne dass andere Benutzer*innen im Cluster betroffen sind, die möglicherweise eine andere Version derselben Bibliothek benötigen. Weitere Informationen finden Sie unter Python-Bibliotheken im Notebook-Bereich.
Wenn Sie eine Bibliothek in einem Notebook installieren, haben nur das aktuelle Notebook und alle diesem Notebook zugeordneten Aufträge Zugriff auf diese Bibliothek. Andere Notebooks, die an denselben Cluster angefügt sind, sind nicht betroffen.