Używanie programu Visual Studio Code z usługą Databricks Connect dla języka Python
Uwaga
W tym artykule opisano usługę Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego.
W tym artykule opisano sposób używania programu Databricks Connect dla języka Python z programem Visual Studio Code. Usługa Databricks Connect umożliwia łączenie popularnych środowisk IDE, serwerów notesów i innych aplikacji niestandardowych z klastrami usługi Azure Databricks. Zobacz Co to jest usługa Databricks Connect?. Aby zapoznać się z wersją tego artykułu, zobacz Use Visual Studio Code with Databricks Connect for Scala (Używanie programu Visual Studio Code z programem Databricks Connect dla języka Scala).
Uwaga
Przed rozpoczęciem korzystania z usługi Databricks Connect należy skonfigurować klienta Usługi Databricks Connect.
Napiwek
Rozszerzenie Databricks dla programu Visual Studio Code ma już wbudowaną obsługę programu Databricks Connect dla środowiska Databricks Runtime 13.3 LTS i nowszych wersji. Zobacz Debugowanie kodu przy użyciu usługi Databricks Connect dla rozszerzenia usługi Databricks dla programu Visual Studio Code.
Aby używać usługi Databricks Connect z programem Visual Studio Code i językiem Python, postępuj zgodnie z tymi instrukcjami.
Uruchom program Visual Studio Code.
Otwórz folder zawierający środowisko wirtualne języka Python (plik > otwórz folder).
W terminalu programu Visual Studio Code (wyświetl > terminal) aktywuj środowisko wirtualne.
Ustaw bieżący interpreter języka Python na taki, do którego odwołuje się środowisko wirtualne:
- Na palecie poleceń (Widok > palety poleceń) wpisz
Python: Select Interpreter
, a następnie naciśnij Enter. - Wybierz ścieżkę do interpretera języka Python, do którego odwołuje się środowisko wirtualne.
- Na palecie poleceń (Widok > palety poleceń) wpisz
Dodaj do folderu plik kodu języka Python (
.py
), który zawiera przykładowy kod lub własny kod. Jeśli używasz własnego kodu, musisz co najmniej zainicjowaćDatabricksSession
kod, jak pokazano w przykładowym kodzie.Aby uruchomić kod, kliknij polecenie Uruchom > bez debugowania w menu głównym. Cały kod w języku Python działa lokalnie, podczas gdy cały kod PySpark obejmujący operacje ramki danych jest uruchamiany w klastrze w zdalnym obszarze roboczym usługi Azure Databricks i uruchamiane odpowiedzi są wysyłane z powrotem do lokalnego obiektu wywołującego.
Aby debugować kod:
- Po otwarciu pliku kodu języka Python ustaw wszystkie punkty przerwania, w których kod ma zostać wstrzymany podczas działania.
- Kliknij ikonę Uruchom i debuguj na pasku bocznym lub kliknij pozycję Wyświetl > uruchom w menu głównym.
- W widoku Uruchamianie i debugowanie kliknij przycisk Uruchom i debuguj.
- Postępuj zgodnie z instrukcjami wyświetlanymi na ekranie, aby rozpocząć uruchamianie i debugowanie kodu.
Cały kod języka Python jest debugowany lokalnie, podczas gdy cały kod PySpark nadal działa w klastrze w zdalnym obszarze roboczym usługi Azure Databricks. Nie można debugować podstawowego kodu aparatu Spark bezpośrednio z klienta.
Aby uzyskać bardziej szczegółowe instrukcje dotyczące uruchamiania i debugowania, zobacz Konfigurowanie i uruchamianie debugera i debugowania języka Python w programie VS Code.