Używanie klasycznego notesu Jupyter Notebook z usługą Databricks Connect dla języka Python
Uwaga
W tym artykule opisano usługę Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego.
W tym artykule opisano sposób używania programu Databricks Connect dla języka Python z klasycznym notesem Jupyter Notebook. Usługa Databricks Connect umożliwia łączenie popularnych serwerów notesów, środowisk IDE i innych aplikacji niestandardowych z klastrami usługi Azure Databricks. Zobacz Co to jest usługa Databricks Connect?.
Uwaga
Przed rozpoczęciem korzystania z usługi Databricks Connect należy skonfigurować klienta Usługi Databricks Connect.
Aby użyć usługi Databricks Connect z klasycznym notesem Jupyter i językiem Python, postępuj zgodnie z tymi instrukcjami.
Aby zainstalować klasyczny notes Jupyter Notebook z aktywowanym środowiskiem wirtualnym języka Python, uruchom następujące polecenie w terminalu lub wierszu polecenia:
pip3 install notebook
Aby uruchomić klasyczny notes Jupyter Notebook w przeglądarce internetowej, uruchom następujące polecenie w aktywowanym środowisku wirtualnym języka Python:
jupyter notebook
Jeśli klasyczny notes Jupyter Notebook nie jest wyświetlany w przeglądarce internetowej, skopiuj adres URL rozpoczynający się od
localhost
lub127.0.0.1
ze środowiska wirtualnego i wprowadź go na pasku adresu przeglądarki internetowej.Utwórz nowy notes: w klasycznym notesie Jupyter Notebook na karcie Pliki kliknij pozycję Nowy > język Python 3 (ipykernel).
W pierwszej komórce notesu wprowadź przykładowy kod lub własny kod. Jeśli używasz własnego kodu, musisz co najmniej zainicjować
DatabricksSession
kod, jak pokazano w przykładowym kodzie.Aby uruchomić notes, kliknij pozycję Komórka > Uruchom wszystko. Cały kod w języku Python działa lokalnie, podczas gdy cały kod PySpark obejmujący operacje ramki danych jest uruchamiany w klastrze w zdalnym obszarze roboczym usługi Azure Databricks i uruchamiane odpowiedzi są wysyłane z powrotem do lokalnego obiektu wywołującego.
Aby debugować notes, dodaj następujący wiersz kodu na początku notesu:
from IPython.core.debugger import set_trace
Następnie wywołaj metodę
set_trace()
, aby wprowadzić instrukcje debugowania w tym momencie wykonywania notesu. Cały kod języka Python jest debugowany lokalnie, podczas gdy cały kod PySpark nadal działa w klastrze w zdalnym obszarze roboczym usługi Azure Databricks. Nie można debugować podstawowego kodu aparatu Spark bezpośrednio z klienta.Aby zamknąć klasyczny notes Jupyter Notebook, kliknij pozycję Zamknij i zatrzymaj plik>. Jeśli klasyczny proces notesu Jupyter jest nadal uruchomiony w terminalu lub wierszu polecenia, zatrzymaj ten proces, naciskając
Ctrl + c
, a następnie wprowadzając poleceniey
, aby potwierdzić.