Biblioteki klastrów
Biblioteki klastra mogą być używane przez wszystkie notesy i zadania uruchomione w klastrze. Ten artykuł zawiera szczegółowe informacje dotyczące używania interfejsu użytkownika instalacji biblioteki w obszarze roboczym usługi Azure Databricks.
Uwaga
Jeśli tworzysz zasoby obliczeniowe przy użyciu zasad wymuszających instalacje bibliotek, nie możesz instalować ani odinstalować bibliotek na obliczeniach. Administratorzy obszaru roboczego kontrolują wszystkie zarządzanie bibliotekami na poziomie zasad.
Biblioteki można zainstalować w klastrze przy użyciu następujących metod:
Zainstaluj bibliotekę do użycia tylko z określonym klastrem.
Zainstaluj bibliotekę przy użyciu interfejsu API REST. Zobacz interfejs API bibliotek.
Zainstaluj bibliotekę przy użyciu interfejsu wiersza polecenia usługi Databricks. Zobacz Co to jest interfejs wiersza polecenia usługi Databricks?.
Zainstaluj bibliotekę przy użyciu narzędzia Terraform. Zobacz Dostawca narzędzia Terraform usługi Databricks i databricks_library.
Zainstaluj bibliotekę, tworząc klaster z zasadami definiującymi instalacje biblioteki. Zobacz Dodawanie bibliotek do zasad.
(Niezalecane) Zainstaluj bibliotekę przy użyciu skryptu init uruchamianego w czasie tworzenia klastra. Zobacz Instalowanie biblioteki za pomocą skryptu init (starsza wersja).
Instalowanie biblioteki w klastrze
Aby zainstalować bibliotekę w klastrze:
- Kliknij pozycję Obliczenia na pasku bocznym.
- Kliknij nazwę klastra.
- Kliknij kartę Biblioteki .
- Kliknij pozycję Zainstaluj nowy.
- Zostanie wyświetlone okno dialogowe Instalowanie biblioteki .
- Wybierz jedną z opcji Źródło biblioteki, wykonaj wyświetlone instrukcje, a następnie kliknij przycisk Zainstaluj.
Ważne
Biblioteki można instalować z systemu plików DBFS podczas korzystania z środowiska Databricks Runtime 14.3 LTS i poniżej. Jednak każdy użytkownik obszaru roboczego może modyfikować pliki biblioteki przechowywane w systemie plików DBFS. Aby zwiększyć bezpieczeństwo bibliotek w obszarze roboczym usługi Azure Databricks, przechowywanie plików bibliotek w katalogu głównym systemu plików DBFS jest domyślnie przestarzałe i wyłączone w środowisku Databricks Runtime 15.1 lub nowszym. Zobacz Przechowywanie bibliotek w katalogu głównym systemu plików DBFS jest domyślnie przestarzałe i wyłączone.
Zamiast tego usługa Databricks zaleca przekazywanie wszystkich bibliotek, w tym bibliotek języka Python, plików JAR i łączników platformy Spark, do plików obszaru roboczego lub woluminów wykazu aparatu Unity lub przy użyciu repozytoriów pakietów biblioteki. Jeśli obciążenie nie obsługuje tych wzorców, możesz również użyć bibliotek przechowywanych w magazynie obiektów w chmurze.
Nie wszystkie tryby dostępu klastra obsługują wszystkie konfiguracje bibliotek. Zobacz Biblioteki o zakresie klastra.
Źródło biblioteki | Instrukcje |
---|---|
Workspace | Wybierz plik obszaru roboczego lub przekaż plik Whl, zipped wheelhouse, JAR, ZIP, tar lub requirements.txt. Zobacz Instalowanie bibliotek z plików obszaru roboczego |
Woluminów | Wybierz plik Whl, JAR lub requirements.txt z woluminu. Zobacz Instalowanie bibliotek z woluminu. |
Ścieżka pliku/usługa ADLS | Wybierz typ biblioteki i podaj pełny identyfikator URI do obiektu biblioteki (na przykład: /Workspace/path/to/library.whl , /Volumes/path/to/library.whl lub abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl ). Zobacz Instalowanie bibliotek z magazynu obiektów. |
PyPI | Wprowadź nazwę pakietu PyPI. Zobacz Pakiet PyPI. |
Maven | Określ współrzędną maven. Zobacz Pakiet Maven lub Spark. |
CRAN | Wprowadź nazwę pakietu. Zobacz Pakiet CRAN. |
DBFS (niezalecane) | Załaduj plik JAR lub Whl do katalogu głównego systemu plików DBFS. Nie jest to zalecane, ponieważ pliki przechowywane w systemie DBFS mogą być modyfikowane przez dowolnego użytkownika obszaru roboczego. |
Po zainstalowaniu biblioteki w klastrze notes już dołączony do tego klastra nie będzie natychmiast widoczny nowej biblioteki. Najpierw należy odłączyć , a następnie ponownie dołączyć notes do klastra.
Uwaga
Biblioteka, która trwa dłużej niż 2 godziny instalacji, zostanie oznaczona jako nieudana.
Instalowanie biblioteki przy użyciu zasad
Jeśli utworzysz klaster przy użyciu zasad wymuszających instalację biblioteki, określone biblioteki zostaną automatycznie zainstalowane w klastrze. Nie można zainstalować dodatkowych bibliotek ani odinstalować żadnych bibliotek.
Administratorzy obszaru roboczego mogą dodawać biblioteki do zasad, umożliwiając im zarządzanie i wymuszanie instalacji bibliotek na wszystkich obliczeniach korzystających z zasad. Aby uzyskać instrukcje administratora, zobacz Dodawanie bibliotek do zasad.
Odinstalowywanie biblioteki z klastra
Uwaga
Po odinstalowaniu biblioteki z klastra biblioteka zostanie usunięta tylko po ponownym uruchomieniu klastra. Do momentu ponownego uruchomienia klastra stan odinstalowanej biblioteki będzie wyświetlany jako Odinstalowywanie oczekujące na ponowne uruchomienie.
Aby odinstalować bibliotekę, możesz użyć interfejsu użytkownika klastra:
- Kliknij pozycję Obliczenia na pasku bocznym.
- Kliknij nazwę klastra.
- Kliknij kartę Biblioteki .
- Zaznacz pole wyboru obok klastra, z którego chcesz odinstalować bibliotekę, kliknij przycisk Odinstaluj, a następnie potwierdź. Stan zmieni się na Odinstaluj oczekujące na ponowne uruchomienie.
Kliknij przycisk Uruchom ponownie i potwierdź , aby odinstalować bibliotekę. Biblioteka zostanie usunięta z karty Biblioteki klastra.
Wyświetlanie bibliotek zainstalowanych w klastrze
- Kliknij pozycję Obliczenia na pasku bocznym.
- Kliknij nazwę klastra.
- Kliknij kartę Biblioteki . Dla każdej biblioteki karta wyświetla nazwę i wersję, typ, stan instalacji i, jeśli zostanie przekazany, plik źródłowy.
Aktualizowanie biblioteki zainstalowanej w klastrze
Aby zaktualizować bibliotekę zainstalowaną w klastrze, odinstaluj starą wersję biblioteki i zainstaluj nową wersję.
Uwaga
Requirements.txt plików nie wymagają odinstalowania i ponownego uruchomienia. Jeśli zmodyfikowano zawartość pliku requirements.txt, możesz po prostu zainstalować go ponownie, aby zaktualizować zawartość zainstalowanego pliku.