Uruchamianie i debugowanie komórek notesu za pomocą usługi Databricks Connect przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code
Notesy można uruchamiać i debugować, jedną komórkę jednocześnie lub wszystkie komórki jednocześnie i wyświetlać ich wyniki w interfejsie użytkownika programu Visual Studio Code przy użyciu rozszerzenia Databricks dla integracji programu Visual Studio Code Databricks Connect. Cały kod działa lokalnie, podczas gdy cały kod obejmujący operacje ramki danych jest uruchamiany w klastrze w zdalnym obszarze roboczym usługi Azure Databricks i uruchamiane odpowiedzi są wysyłane z powrotem do lokalnego obiektu wywołującego. Cały kod jest debugowany lokalnie, podczas gdy cały kod Platformy Spark nadal działa w klastrze w zdalnym obszarze roboczym usługi Azure Databricks. Nie można debugować podstawowego kodu aparatu Spark bezpośrednio z klienta.
Uwaga
Ta funkcja działa w środowisku Databricks Runtime 13.3 lub nowszym.
Aby włączyć integrację usługi Databricks Connect dla notesów w rozszerzeniu Databricks dla programu Visual Studio Code, należy zainstalować program Databricks Connect w rozszerzeniu Databricks dla programu Visual Studio Code. Zobacz Debugowanie kodu przy użyciu usługi Databricks Connect dla rozszerzenia usługi Databricks dla programu Visual Studio Code.
Uruchamianie komórek notesu języka Python
W przypadku notesów z nazwami plików, które mają .py
rozszerzenie, po otwarciu notesu w środowisku IDE programu Visual Studio Code każda komórka wyświetla przyciski Uruchom komórkę, Uruchom powyżej i Debuguj komórkę . Po uruchomieniu komórki jej wyniki są wyświetlane na osobnej karcie w środowisku IDE. Podczas debugowania komórka debugowana wyświetla przyciski Kontynuuj, Zatrzymaj i Przekroj. Podczas debugowania komórki można użyć funkcji debugowania programu Visual Studio Code, takich jak obserwowanie stanów zmiennych i wyświetlanie stosu wywołań i konsoli debugowania.
W przypadku notesów z nazwami plików, które mają .ipynb
rozszerzenie, po otwarciu notesu w środowisku IDE programu Visual Studio Code notes i jego komórki zawierają dodatkowe funkcje. Zobacz Uruchamianie komórek i Praca z komórkami kodu w Edytorze notesów.
Aby uzyskać więcej informacji na temat formatów notesów dla nazw plików z .py
rozszerzeniami i .ipynb
, zobacz Eksportowanie i importowanie notesów usługi Databricks.
Uruchamianie komórek notatnika Jupyter w języku Python
Aby uruchomić lub debugować notes Jupyter języka Python (.ipynb
):
W projekcie otwórz notes Jupyter języka Python, który chcesz uruchomić lub debugować. Upewnij się, że plik języka Python jest w formacie notesu Jupyter i ma rozszerzenie
.ipynb
.Napiwek
Możesz utworzyć nowy notes Jupyter języka Python, uruchamiając >polecenie Create: New Jupyter Notebook z poziomu palety poleceń.
Kliknij przycisk Uruchom wszystkie komórki, aby uruchomić wszystkie komórki bez debugowania, Wykonaj komórkę, aby uruchomić pojedynczą odpowiednią komórkę bez debugowania lub Uruchom liniowo, aby uruchomić pojedynczą komórkę linia po linii z ograniczoną możliwością debugowania, a zmienna values jest wyświetlana w panelu Jupyter (Widok > Otwórz widok > Jupyter).
Aby przeprowadzić pełne debugowanie w pojedynczej komórce, ustaw set punkty przerwania, a następnie kliknij Debuguj komórkę w menu obok przycisku Uruchom.
Po kliknięciu dowolnej z tych opcji może zostać wyświetlony monit o zainstalowanie brakujących zależności pakietu notesu Jupyter w języku Python. Kliknij, aby zainstalować.
Aby uzyskać więcej informacji, zobacz Jupyter Notebooks in VS Code (Notesy Jupyter w programie VS Code).
Globalne notesy
Następujące globalne notesy są również włączone:
spark
, reprezentujące instancjędatabricks.connect.DatabricksSession
, jest wstępnie skonfigurowane do utworzenia instancjiDatabricksSession
poprzez pobranie uwierzytelnienia Azure Databricks credentials z rozszerzenia. JeśliDatabricksSession
w kodzie komórki notesu są już tworzone wystąpienia, teDatabricksSession
ustawienia są używane. Zobacz Przykłady kodu dla programu Databricks Connect dla języka Python.udf
, wstępnie skonfigurowany jako alias dlapyspark.sql.functions.udf
, który jest aliasem dla funkcji UDF języka Python. Zobacz pyspark.sql.functions.udf.sql
, wstępnie skonfigurowany jako alias dla .spark.sql
spark
, zgodnie z wcześniejszym opisem, reprezentuje wstępnie skonfigurowane wystąpienie klasydatabricks.connect.DatabricksSession
. Zobacz Spark SQL.dbutils
, wstępnie skonfigurowane jako wystąpienie narzędzi usługi Databricks, które jest importowane zdatabricks-sdk
i jest tworzone przez pobranie credentials uwierzytelniania usługi Azure Databricks z rozszerzenia. Zobacz Use Databricks Utilities (Korzystanie z narzędzi usługi Databricks).Uwaga
Tylko podzbiór narzędzi usługi Databricks jest obsługiwany w przypadku notesów z usługą Databricks Connect.
Aby włączyć
dbutils.widgets
usługę , musisz najpierw zainstalować zestaw SDK usługi Databricks dla języka Python, uruchamiając następujące polecenie w terminalu lokalnej maszyny deweloperskiej:pip install 'databricks-sdk[notebook]'
display
, wstępnie skonfigurowany jako alias dla wbudowanegoIPython.display.display
programu Jupyter . Zobacz IPython.display.display.displayHTML
, wstępnie skonfigurowany jako alias dladbruntime.display.displayHTML
elementu , który jest aliasem dladisplay.HTML
elementu zipython
. Zobacz IPython.display.html.
Magie notesu
Włączono również następujące magie notesu:
%fs
, który jest taki sam jak wykonywaniedbutils.fs
wywołań. Zobacz Mix languages (Mieszanie języków).%sh
, które uruchamia polecenie za pomocą magii%%script
komórki na komputerze lokalnym. Nie uruchamia to polecenia w zdalnym obszarze roboczym usługi Azure Databricks. Zobacz Mix languages (Mieszanie języków).%md
i%md-sandbox
, które uruchamia magię%%markdown
komórki . Zobacz Mix languages (Mieszanie języków).%sql
, który uruchamia poleceniespark.sql
. Zobacz Mix languages (Mieszanie języków).%pip
, który działapip install
na komputerze lokalnym. Nie jest to uruchamianepip install
w zdalnym obszarze roboczym usługi Azure Databricks. Zobacz Zarządzanie bibliotekami za pomocą poleceń narzędzia %.%run
, który uruchamia inny notes. Zobacz Uruchamianie notesu usługi Databricks z innego notesu.Uwaga
Aby włączyć
%run
program , należy najpierw zainstalować bibliotekę nbformat , uruchamiając następujące polecenie w terminalu lokalnej maszyny deweloperskiej:pip install nbformat
Dodatkowe funkcje, które są włączone, obejmują:
- Ramki danych Spark są konwertowane na ramki danych pandas, które są wyświetlane w formacie table Jupyter.
Ograniczenia
Ograniczenia uruchamiania komórek w notesach w programie Visual Studio Code obejmują:
- Notesy magie
%r
i%scala
nie są obsługiwane i wyświetlają błąd, jeśli zostanie wywołany. Zobacz Mix languages (Mieszanie języków). - Czary notatnika
%sql
nie obsługują niektórych poleceń DML, takich jak Show Tables.