Biblioteki obszarów roboczych (starsza wersja)
Ważne
Ta dokumentacja została wycofana i może nie zostać zaktualizowana. Produkty, usługi lub technologie wymienione w tej zawartości nie są już obsługiwane. Zobacz Biblioteki klastrów.
Uwaga
Biblioteki obszarów roboczych zostały przestarzałe i nie powinny być używane. Jednak przechowywanie bibliotek jako plików obszaru roboczego różni się od bibliotek obszarów roboczych i nadal jest w pełni obsługiwane. Biblioteki przechowywane jako pliki obszaru roboczego można zainstalować bezpośrednio w zadaniach obliczeniowych lub zadań podrzędnych.
Biblioteki obszarów roboczych stanowią lokalne repozytorium, na podstawie którego można tworzyć biblioteki zainstalowane przez klastry. Biblioteka obszaru roboczego może zawierać kod niestandardowy utworzony przez Twoją organizację lub może być określoną wersją biblioteki open source, standardowo wykorzystywanej przez Twoją organizację.
Aby można było go użyć w notesie lub zadaniu, musisz zainstalować bibliotekę obszarów roboczych w klastrze. Zobacz Instalowanie biblioteki obszarów roboczych w klastrze.
Biblioteki obszarów roboczych w folderze Udostępnione są dostępne dla wszystkich użytkowników w obszarze roboczym, a biblioteki obszarów roboczych w folderze użytkownika są dostępne tylko dla tego użytkownika.
Ważne
Biblioteki można instalować z systemu plików DBFS podczas korzystania z środowiska Databricks Runtime 14.3 LTS i poniżej. Jednak każdy użytkownik obszaru roboczego może modyfikować pliki biblioteki przechowywane w systemie plików DBFS. Aby zwiększyć bezpieczeństwo bibliotek w obszarze roboczym usługi Azure Databricks, przechowywanie plików bibliotek w katalogu głównym systemu plików DBFS jest domyślnie przestarzałe i wyłączone w środowisku Databricks Runtime 15.1 lub nowszym. Zobacz Przechowywanie bibliotek w katalogu głównym systemu plików DBFS jest domyślnie przestarzałe i wyłączone.
Zamiast tego usługa Databricks zaleca przekazywanie wszystkich bibliotek, w tym bibliotek języka Python, plików JAR i łączników platformy Spark, do plików obszaru roboczego lub woluminów wykazu aparatu Unity lub przy użyciu repozytoriów pakietów biblioteki. Jeśli obciążenie nie obsługuje tych wzorców, możesz również użyć bibliotek przechowywanych w magazynie obiektów w chmurze.
Jak biblioteki obszarów roboczych różnią się od bibliotek przechowywanych z plikami obszaru roboczego?
Termin "biblioteki obszarów roboczych" odnosi się do dowolnej biblioteki zarejestrowanej w obszarze roboczym. Biblioteki obszarów roboczych są wyświetlane wraz z notesami i plikami obszarów roboczych i postępuj zgodnie z regułami listy ACL dla ich katalogu zawierającego.
Termin "pliki obszaru roboczego" odnosi się do dowolnego pliku przechowywanego w obszarze roboczym. Pakiety .whl języka Python można przechowywać jako pliki obszaru roboczego, a następnie rejestrować je jako biblioteki obszarów roboczych. Zobacz Co to są pliki obszaru roboczego?.
Biblioteki można przekazywać jako pliki obszaru roboczego. Zobacz Podstawowe użycie plików obszaru roboczego.
Chociaż można przekazać wiele typów plików do plików obszaru roboczego, można zainstalować tylko pliki whl języka Python przy użyciu plików obszaru roboczego. Zobacz Biblioteki o zakresie klastra.
W środowisku Databricks Runtime 13.3 LTS lub nowszym można użyć %pip
do zainstalowania plików wheel języka Python przechowywanych jako pliki obszaru roboczego. Zobacz Instalowanie pakietu przechowywanego jako plik obszaru roboczego za pomocą narzędzia %.
Tworzenie biblioteki obszarów roboczych
Ostrzeżenie
Ta funkcja nie jest już dostępna. Zobacz Tworzenie i instalowanie bibliotek obszarów roboczych nie jest już dostępne.
- Kliknij prawym przyciskiem myszy folder obszaru roboczego, w którym chcesz przechowywać bibliotekę.
- Wybierz pozycję Utwórz > bibliotekę. Zostanie wyświetlone okno dialogowe Tworzenie biblioteki.
- Wybierz źródło biblioteki i postępuj zgodnie z odpowiednią procedurą:
Przekazywanie pliku jar, python egg lub python wheel
Uwaga
Instalowanie plików jaj języka Python jest przestarzałe i zostanie usunięte w przyszłej wersji środowiska Databricks Runtime.
Ważne
Biblioteki można instalować z systemu plików DBFS podczas korzystania z środowiska Databricks Runtime 14.3 LTS i poniżej. Jednak każdy użytkownik obszaru roboczego może modyfikować pliki biblioteki przechowywane w systemie plików DBFS. Aby zwiększyć bezpieczeństwo bibliotek w obszarze roboczym usługi Azure Databricks, przechowywanie plików bibliotek w katalogu głównym systemu plików DBFS jest domyślnie przestarzałe i wyłączone w środowisku Databricks Runtime 15.1 lub nowszym. Zobacz Przechowywanie bibliotek w katalogu głównym systemu plików DBFS jest domyślnie przestarzałe i wyłączone.
Zamiast tego usługa Databricks zaleca przekazywanie wszystkich bibliotek, w tym bibliotek języka Python, plików JAR i łączników platformy Spark, do plików obszaru roboczego lub woluminów wykazu aparatu Unity lub przy użyciu repozytoriów pakietów biblioteki. Jeśli obciążenie nie obsługuje tych wzorców, możesz również użyć bibliotek przechowywanych w magazynie obiektów w chmurze.
- Na liście przycisków Źródło biblioteki wybierz pozycję Przekaż.
- Wybierz pozycję Jar, Python Egg lub Python Whl.
- Opcjonalnie wprowadź nazwę biblioteki.
- Przeciągnij plik Jar, Egg lub Whl do pola upuszczania lub kliknij pole upuszczania i przejdź do pliku. Plik jest przekazywany do
dbfs:/FileStore/jars
pliku . - Kliknij pozycję Utwórz. Zostanie wyświetlony ekran stanu biblioteki.
Odwoływanie się do przekazanego pliku JAR, python egg lub python wheel
Nową bibliotekę obszarów roboczych można utworzyć, odwołując się do plików JAR, Python egg lub Python wheel przechowywanych w katalogu głównym systemu plików DBFS, w magazynie obiektów lub w plikach obszaru roboczego. Po wykonaniu tego przepływu pracy wskaźnik jest rejestrowany w bibliotece bez przekazywania lub przenoszenia plików.
Za pomocą środowiska Databricks Runtime 13.2 lub nowszego można również odwołać się do woluminu w wykazie aparatu Unity. Ta funkcja jest dostępna w publicznej wersji zapoznawczej.
W przypadku trybu dostępu współdzielonego należy dodać pliki JAR do elementu allowlist
. Zobacz Allowlist libraries and init scripts on shared compute (Biblioteki dozwolonych i skrypty inicjowania w udostępnionych obliczeniach).
- Wybierz pozycję Ścieżka pliku/USŁUGA ADLS na liście przycisków Źródło biblioteki.
- Wybierz pozycję Jar, Python Egg lub Python Whl.
- Opcjonalnie wprowadź nazwę biblioteki.
- Określ ścieżkę do biblioteki, na przykład następujące przykłady:
abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
/Workspace/path/to/library.whl
dbfs:/path/to/library.whl
/Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
- Kliknij pozycję Utwórz. Zostanie wyświetlony ekran stanu biblioteki.
Aby uzyskać więcej informacji na temat pracy z bibliotekami w magazynie obiektów, zobacz Instalowanie bibliotek z magazynu obiektów.
Aby uzyskać więcej informacji na temat plików obszarów roboczych, zobacz Praca z plikami w usłudze Azure Databricks.
Instalowanie biblioteki obszarów roboczych w klastrze
Uwaga
Usługa Azure Databricks przetwarza wszystkie biblioteki obszarów roboczych w kolejności, w której zostały zainstalowane w klastrze. Może być konieczne zwrócenie uwagi na kolejność instalacji klastra, jeśli istnieją zależności między bibliotekami.
Ważne
Biblioteki można instalować z systemu plików DBFS podczas korzystania z środowiska Databricks Runtime 14.3 LTS i poniżej. Jednak każdy użytkownik obszaru roboczego może modyfikować pliki biblioteki przechowywane w systemie plików DBFS. Aby zwiększyć bezpieczeństwo bibliotek w obszarze roboczym usługi Azure Databricks, przechowywanie plików bibliotek w katalogu głównym systemu plików DBFS jest domyślnie przestarzałe i wyłączone w środowisku Databricks Runtime 15.1 lub nowszym. Zobacz Przechowywanie bibliotek w katalogu głównym systemu plików DBFS jest domyślnie przestarzałe i wyłączone.
Zamiast tego usługa Databricks zaleca przekazywanie wszystkich bibliotek, w tym bibliotek języka Python, plików JAR i łączników platformy Spark, do plików obszaru roboczego lub woluminów wykazu aparatu Unity lub przy użyciu repozytoriów pakietów biblioteki. Jeśli obciążenie nie obsługuje tych wzorców, możesz również użyć bibliotek przechowywanych w magazynie obiektów w chmurze.
W trybie dostępu pojedynczego użytkownika jest używana tożsamość przypisanej jednostki (użytkownika lub jednostki usługi). W trybie dostępu współdzielonego biblioteki używają tożsamości użytkownika, który zainstalował bibliotekę. Tryb dostępu współdzielonego bez izolacji nie obsługuje woluminów, ale używa tego samego przypisania tożsamości co tryb dostępu współdzielonego.
Aby wyświetlić wszystkie opcje instalowania bibliotek w klastrach, zobacz Biblioteki klastrów.
Aby zainstalować bibliotekę, która już istnieje w obszarze roboczym, możesz rozpocząć od interfejsu użytkownika klastra lub interfejsu użytkownika biblioteki:
Klaster
- Na pasku bocznym kliknij pozycję Obliczenia.
- Kliknij nazwę klastra.
- Kliknij kartę Biblioteki .
- Kliknij pozycję Zainstaluj nowy.
- Na liście przycisków Źródło biblioteki wybierz pozycję Biblioteka obszarów roboczych.
- Wybierz bibliotekę obszarów roboczych.
- Kliknij przycisk Zainstaluj.
Biblioteka
- Przejdź do folderu zawierającego bibliotekę.
- Kliknij nazwę biblioteki.
- Zaznacz pole wyboru obok klastra, w którym chcesz zainstalować bibliotekę, a następnie kliknij przycisk Zainstaluj. Na liście są wyświetlane tylko uruchomione klastry.
Wyświetlanie szczegółów biblioteki obszarów roboczych
Uwaga
Foldery obszarów roboczych zapewniają wygodę odnajdywania bibliotek obszarów roboczych i zarządzania listami ACL.
- Przejdź do folderu obszaru roboczego zawierającego bibliotekę.
- Kliknij nazwę biblioteki.
Na stronie szczegółów biblioteki są wyświetlane uruchomione klastry i stan instalacji biblioteki. Jeśli biblioteka jest zainstalowana, strona zawiera link do hosta pakietu. Jeśli biblioteka została przekazana, na stronie zostanie wyświetlony link do przekazanego pliku pakietu.
Przenoszenie biblioteki obszarów roboczych
Uwaga
Foldery obszarów roboczych zapewniają wygodę odnajdywania bibliotek obszarów roboczych i zarządzania listami ACL. Przenoszenie biblioteki obszarów roboczych nie powoduje przeniesienia plików, ale może modyfikować użytkowników, którzy mają dostęp do biblioteki obszarów roboczych.
- Przejdź do folderu obszaru roboczego zawierającego bibliotekę.
- Kliknij prawym przyciskiem myszy nazwę biblioteki i wybierz polecenie Przenieś. Zostanie wyświetlona przeglądarka folderów.
- Kliknij folder docelowy.
- Kliknij pozycję Przenieś.
Usuwanie biblioteki obszarów roboczych
Ważne
Przed usunięciem biblioteki obszarów roboczych należy odinstalować ją ze wszystkich klastrów.
Aby usunąć bibliotekę obszarów roboczych:
- Przenieś bibliotekę do folderu Kosz.
- Trwale usuń bibliotekę w folderze Kosz lub opróżnij folder Kosz.