Co to jest rozszerzenie usługi Databricks dla programu Visual Studio Code?
Rozszerzenie usługi Databricks dla programu Visual Studio Code umożliwia łączenie się ze zdalnymi obszarami roboczymi usługi Azure Databricks z poziomu zintegrowanego środowiska projektowego (IDE) programu Visual Studio Code uruchomionego na lokalnej maszynie deweloperów. Następnie można wykonywać czynności takie jak:
- Zdefiniuj, wdróż i uruchom pakiety zasobów usługi Databricks, aby zastosować wzorce ciągłej integracji/ciągłego wdrażania oraz najlepsze rozwiązania w zadaniach usługi Azure Databricks, potokach delta live tables i stosach MLOps przy użyciu interfejsu użytkownika programu Visual Studio Code. Zobacz Co to są pakiety zasobów usługi Databricks? i Funkcje rozszerzeń pakietów zasobów usługi Databricks.
- Uruchamianie lokalnych plików kodu w języku Python z programu Visual Studio Code w klastrach usługi Azure Databricks w zdalnych obszarach roboczych. Zobacz Uruchamianie pliku w języku Python w klastrze
- Uruchom lokalne pliki kodu języka Python (
.py
) i python, R, Scala i NOTESy SQL (.py
,.ipynb
,.r
,.scala
i.sql
) z programu Visual Studio Code jako zadania usługi Azure Databricks w zdalnych obszarach roboczych. Zobacz Uruchamianie pliku w języku Python jako zadania. - Skonfiguruj i skonfiguruj środowisko debugowania oraz program Databricks Connect przy użyciu prostej listy kontrolnej, która wyzwala okna dialogowe wyboru. Zobacz Debugowanie kodu przy użyciu usługi Databricks Connect dla rozszerzenia usługi Databricks dla programu Visual Studio Code.
- Debugowanie komórki notesów według komórki w programie Visual Studio Code za pomocą usługi Databricks Connect. Zobacz Run and debug notebook cells with Databricks Connect using the Databricks extension for Visual Studio Code (Uruchamianie i debugowanie komórek notesu za pomocą programu Databricks Connect przy użyciu rozszerzenia databricks dla programu Visual Studio Code).
- Zsynchronizuj kod lokalny opracowywany w programie Visual Studio Code z kodem w zdalnych obszarach roboczych.
Uwaga
Rozszerzenie Databricks dla programu Visual Studio Code obsługuje uruchamianie notesów języka R, Scala i SQL jako zadań automatycznych, ale nie zapewnia głębszej obsługi tych języków w programie Visual Studio Code.
Rozpocznij
Aby rozpocząć korzystanie z rozszerzenia usługi Databricks dla programu Visual Studio Code:
- Zainstaluj rozszerzenie.
- Utwórz nowy projekt usługi Databricks lub zmigruj istniejący projekt programu Visual Studio Code.
- Skonfiguruj projekt łatwo przy użyciu interfejsu użytkownika rozszerzenia usługi Databricks.
- Uruchom kod języka Python w ramach samouczka rozszerzenia.
- Debugowanie kodu przy użyciu integracji usługi Databricks Connect.
- Przetestuj kod przy użyciu polecenia
pytest
. Zobacz Run tests with pytest using the Databricks extension for Visual Studio Code (Uruchamianie testów za pomocą narzędzia pytest przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code).
Tworzenie nowego projektu usługi Databricks
Po zainstalowaniu rozszerzenia można utworzyć nowy projekt usługi Databricks przy użyciu rozszerzenia databricks dla programu Visual Studio Code:
- Uruchom program Visual Studio Code.
- Kliknij ikonę usługi Databricks na pasku bocznym programu Visual Studio Code, aby otworzyć rozszerzenie.
- Kliknij pozycję Utwórz nowy projekt usługi Databricks.
- W palecie poleceń wybierz hosta i metodę uwierzytelniania dla projektu. Zobacz Konfigurowanie uwierzytelniania dla rozszerzenia usługi Databricks dla programu Visual Studio Code.
- W obszarze Podaj ścieżkę do folderu, w którym ma znajdować się nowy projekt, wprowadź ścieżkę do folderu na komputerze dewelopera lokalnego, na którym chcesz utworzyć projekt, lub kliknij okno dialogowe Otwórz wybór folderu i wybierz ścieżkę do folderu projektu.
- Aby użyć szablonu w widoku inicjowania projektu usługi Databricks, użyj strzałek w górę i w dół, aby wybrać szablon projektu, a następnie naciśnij Enter. Aby uzyskać informacje na temat szablonów projektów pakietów, zobacz Szablony projektów pakietu zasobów usługi Databricks.
- Wpisz unikatową nazwę dla tego projektu lub pozostaw domyślną nazwę
my_project
projektu , a następnie naciśnij Enter. - Wybierz, czy chcesz dodać notes wycinkowy (przykład), potok delta live tables (przykład) lub wycinkę (przykładową) pakiet języka Python do projektu, czy dowolną kombinację tych wycinków (przykłady).
- Naciśnij dowolny, aby zamknąć kartę Edytor init projektu usługi Databricks.
- W obszarze Wybierz projekt, który chcesz otworzyć, wybierz właśnie utworzony projekt.
Migrowanie projektu do projektu usługi Databricks
Jeśli masz istniejący projekt, który chcesz przeprowadzić migrację do projektu usługi Databricks, otwórz go za pomocą rozszerzenia Databricks dla programu Visual Studio Code, aby rozpocząć migrację:
- Uruchom program Visual Studio Code. W menu głównym kliknij pozycję Plik>Otwórz folder i przejdź do projektu, aby go otworzyć.
- Kliknij ikonę usługi Databricks na pasku bocznym programu Visual Studio Code, aby otworzyć rozszerzenie.
- Kliknij pozycję Migruj do projektu usługi Databricks.
- W palecie poleceń wybierz hosta i metodę uwierzytelniania dla projektu. Zobacz Konfigurowanie uwierzytelniania dla rozszerzenia usługi Databricks dla programu Visual Studio Code.
Uwaga
Jeśli otworzysz projekt utworzony przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code w wersji 1, migracja zostanie podjęta automatycznie przy użyciu istniejącej konfiguracji uwierzytelniania i obszaru roboczego projektu. Przycisk migracji jest dostępny tylko wtedy, gdy migracja automatyczna zakończy się niepowodzeniem.
Otwieranie istniejącego projektu pakietu zasobów usługi Databricks
Jeśli rozszerzenie usługi Databricks dla programu Visual Studio Code odnajduje więcej niż jeden projekt Pakietu zasobów usługi Databricks w bieżącym folderze, rozszerzenie usługi Databricks dla programu Visual Studio Code umożliwia wybranie projektu do otwarcia.
Uwaga
Projekt Pakietu zasobów usługi Databricks zawiera databricks.yml
plik w folderze głównym projektu. Zobacz Konfiguracja pakietu zasobów usługi Databricks.
Uruchom program Visual Studio Code. W menu głównym kliknij pozycję Plik>Otwórz folder i przejdź do katalogu zawierającego projekt pakietu.
Kliknij ikonę usługi Databricks na pasku bocznym programu Visual Studio Code, aby otworzyć rozszerzenie.
Kliknij pozycję Otwórz istniejący projekt usługi Databricks.
W palecie poleceń wybierz istniejący projekt Pakiety zasobów usługi Databricks.
W palecie poleceń wybierz hosta i metodę uwierzytelniania dla projektu. Zobacz Konfigurowanie uwierzytelniania dla rozszerzenia usługi Databricks dla programu Visual Studio Code.
Dodawanie innego projektu usługi Databricks do obszaru roboczego
Rozszerzenie usługi Databricks dla programu Visual Studio Code umożliwia posiadanie wielu projektów usługi Databricks w obszarze roboczym programu Visual Studio Code i łatwe przełączanie się między nimi. Aby dodać kolejny projekt:
Uruchom program Visual Studio Code. W menu głównym kliknij pozycję Plik>Dodaj folder do obszaru roboczego i przejdź do katalogu zawierającego inny projekt pakietu.
Kliknij ikonę usługi Databricks na pasku bocznym programu Visual Studio Code, aby otworzyć rozszerzenie.
Kliknij pozycję Aktywny folder obszaru roboczego, aby wybrać projekt rozszerzenia do użycia.