Używanie narzędzia JupyterLab z usługą Databricks Connect dla języka Python
Uwaga
W tym artykule opisano usługę Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego.
W tym artykule opisano sposób używania programu Databricks Connect dla języka Python z rozwiązaniem JupyterLab. Usługa Databricks Connect umożliwia łączenie popularnych serwerów notesów, środowisk IDE i innych aplikacji niestandardowych z klastrami usługi Azure Databricks. Zobacz Co to jest usługa Databricks Connect?.
Uwaga
Przed rozpoczęciem korzystania z usługi Databricks Connect należy skonfigurować klienta Usługi Databricks Connect.
Aby używać usługi Databricks Connect z oprogramowaniem JupyterLab i językiem Python, postępuj zgodnie z tymi instrukcjami.
Aby zainstalować narzędzie JupyterLab z aktywowanym środowiskiem wirtualnym języka Python, uruchom następujące polecenie w terminalu lub wierszu polecenia:
pip3 install jupyterlab
Aby uruchomić aplikację JupyterLab w przeglądarce internetowej, uruchom następujące polecenie w aktywowanym środowisku wirtualnym języka Python:
jupyter lab
Jeśli aplikacja JupyterLab nie jest wyświetlana w przeglądarce internetowej, skopiuj adres URL rozpoczynający się od
localhost
lub127.0.0.1
ze środowiska wirtualnego i wprowadź go na pasku adresu przeglądarki internetowej.Utwórz nowy notes: w programie JupyterLab kliknij pozycję Plik > nowy > notes w menu głównym, wybierz pozycję Python 3 (ipykernel), a następnie kliknij pozycję Wybierz.
W pierwszej komórce notesu wprowadź przykładowy kod lub własny kod. Jeśli używasz własnego kodu, musisz co najmniej zainicjować
DatabricksSession
kod, jak pokazano w przykładowym kodzie.Aby uruchomić notes, kliknij pozycję Uruchom > wszystkie komórki. Cały kod działa lokalnie, podczas gdy cały kod obejmujący operacje ramki danych jest uruchamiany w klastrze w zdalnym obszarze roboczym usługi Azure Databricks i uruchamiane odpowiedzi są wysyłane z powrotem do lokalnego obiektu wywołującego.
Aby debugować notes, kliknij ikonę usterki (Włącz debuger) obok pozycji Python 3 (ipykernel) na pasku narzędzi notesu. Ustaw co najmniej jeden punkt przerwania, a następnie kliknij przycisk Uruchom > wszystkie komórki. Cały kod jest debugowany lokalnie, podczas gdy cały kod Platformy Spark nadal działa w klastrze w zdalnym obszarze roboczym usługi Azure Databricks. Nie można debugować podstawowego kodu aparatu Spark bezpośrednio z klienta.
Aby zamknąć aplikację JupyterLab, kliknij pozycję Zamknij plik>. Jeśli proces JupyterLab nadal działa w terminalu lub wierszu polecenia, zatrzymaj ten proces, naciskając
Ctrl + c
, a następnie wprowadzając poleceniey
, aby potwierdzić.
Aby uzyskać bardziej szczegółowe instrukcje debugowania, zobacz Debuger.