Udostępnij za pośrednictwem


Konfigurowanie projektu usługi Databricks przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code

Rozszerzenie usługi Databricks dla programu Visual Studio Code oferuje widok konfiguracji w panelu rozszerzenia, który umożliwia łatwe konfigurowanie i aktualizowanie ustawień projektu usługi Databricks. Te funkcje obejmują selektor wdrożenia docelowego obszaru roboczego, łatwą konfigurację uwierzytelniania i obliczeń, synchronizację folderów obszaru roboczego i proste kroki aktywowania środowiska wirtualnego języka Python niezbędnego do debugowania.

Widok Konfiguracja w rozszerzeniu usługi Databricks dla programu Visual Studio Code jest dostępny po utworzeniu lub zmigrowanym projekcie do projektu usługi Databricks. Zobacz Tworzenie nowego projektu usługi Databricks.

Uwaga

We wcześniejszych wersjach rozszerzenia usługi Databricks dla programu Visual Studio Code zdefiniowane ustawienia konfiguracji w pliku JSON projektu i zmiennych środowiskowych zostały ustawione w terminalu. W wersji wydania konfiguracja projektu i środowiska znajduje się w plikach databricks.yml i databricks.env .

Jeśli projekt jest pakietem zasobów usługi Databricks, interfejs użytkownika rozszerzenia usługi Databricks udostępnia również Eksplorator zasobów pakietu i widok zmiennych pakietu w celu zarządzania zasobami i zmiennymi pakietu. Zobacz Funkcje rozszerzenia pakietu zasobów usługi Databricks.

Zmienianie docelowego obszaru roboczego wdrożenia

Aby wybrać lub przełączyć docelowy obiekt docelowy wdrożenia dla projektu usługi Databricks (na przykład, aby przełączyć się z dev miejsca docelowego na docelowy prod ):

  1. W widoku Konfiguracja panelu rozszerzenia usługi Databricks kliknij ikonę koła zębatego (wybierz element docelowy pakietu zasobów usługi Databricks) skojarzony z elementem docelowym.

    Wybieranie elementu docelowego pakietu zasobów usługi Databricks

  2. W palecie poleceń wybierz żądany cel wdrożenia.

Po skonfigurowaniu elementu docelowego zostanie wyświetlony tryb hosta i wdrożenia. Aby uzyskać informacje na temat trybów wdrażania pakietów zasobów usługi Databricks, zobacz Tryby wdrażania pakietu zasobów usługi Databricks.

Host obszaru roboczego można zmienić, modyfikując ustawienie docelowe workspace w databricks.yml pliku konfiguracji skojarzonym z projektem. Zobacz cele.

Uwaga

Następujące rozszerzenie usługi Databricks dla funkcji programu Visual Studio Code jest dostępne tylko wtedy, gdy jest opracowywany docelowy tryb wdrażania:

  • Używanie dołączonego klastra programistycznego na potrzeby zadań pakietu
  • Synchronizowanie plików folderów obszaru roboczego
  • Wybieranie interaktywnego klastra programistycznego

Konfigurowanie profilu usługi Databricks dla projektu

Podczas tworzenia projektu usługi Databricks lub migrowania projektu jako projektu usługi Databricks należy skonfigurować profil zawierający ustawienia uwierzytelniania używane do nawiązywania połączenia z usługą Databricks. Jeśli chcesz zmienić używany profil uwierzytelniania, kliknij ikonę koła zębatego skojarzonego z AuthType w widoku Konfiguracja .

Aby uzyskać więcej informacji na temat rozszerzenia usługi Databricks na potrzeby uwierzytelniania programu Visual Studio Code, zobacz Konfigurowanie uwierzytelniania rozszerzenia usługi Databricks dla programu Visual Studio Code.

Wybieranie klastra do uruchamiania kodu i zadań

Korzystając z rozszerzenia usługi Databricks dla programu Visual Studio Code, możesz wybrać istniejący klaster usługi Azure Databricks lub utworzyć nowy klaster usługi Azure Databricks na potrzeby uruchamiania kodu i zadań. Po nawiązaniu połączenia z obliczeniami wyświetlany jest identyfikator klastra, wersja środowiska Databricks Runtime, twórca, stan i tryb dostępu. Możesz również uruchomić i zatrzymać klaster, a następnie przejść bezpośrednio do szczegółów strony klastra.

Napiwek

Jeśli nie chcesz czekać na uruchomienie klastra zadań, sprawdź klaster Zastąpić zadania w pakiecie tuż poniżej wybranego klastra, aby użyć wybranego klastra do uruchamiania zadań pakietu w trybie programowania.

Korzystanie z istniejącego klastra

Jeśli masz istniejący klaster usługi Azure Databricks, którego chcesz użyć:

  1. W widoku Konfiguracja obok pozycji Klaster kliknij pozycję Wybierz klaster lub ikonę koła zębatego (Konfiguruj klaster).

    Konfigurowanie klastra

  2. W palecie poleceń wybierz klaster, którego chcesz użyć.

Tworzenie nowego klastra

Jeśli nie masz istniejącego klastra usługi Azure Databricks lub chcesz utworzyć nowy klaster:

  1. W widoku Konfiguracja obok pozycji Klaster kliknij ikonę koła zębatego (Konfiguruj klaster).

  2. W palecie poleceń kliknij pozycję Utwórz nowy klaster.

  3. Po wyświetleniu monitu o otwarcie zewnętrznej witryny internetowej (obszaru roboczego usługi Azure Databricks) kliknij przycisk Otwórz.

  4. Jeśli zostanie wyświetlony monit, zaloguj się do obszaru roboczego usługi Azure Databricks.

  5. Postępuj zgodnie z instrukcjami, aby utworzyć klaster.

    Uwaga

    Usługa Databricks zaleca utworzenie klastra obliczeniowego osobistego. Dzięki temu można natychmiast rozpocząć uruchamianie obciążeń, minimalizując obciążenie związane z zarządzaniem obliczeniami.

  6. Po utworzeniu i uruchomieniu klastra wróć do programu Visual Studio Code.

  7. W widoku Konfiguracja obok pozycji Klaster kliknij ikonę koła zębatego (Konfiguruj klaster).

    Konfigurowanie ikony klastra 3

    W palecie poleceń kliknij klaster, którego chcesz użyć.

Synchronizowanie folderu obszaru roboczego z usługą Databricks

Zdalny folder obszaru roboczego usługi Databricks skojarzony z projektem usługi Databricks można zsynchronizować, klikając ikonę synchronizacji (Rozpocznij synchronizację) skojarzona z folderem obszaru roboczego w widoku Konfiguracja panelu rozszerzenia usługi Databricks.

Uwaga

Rozszerzenie usługi Databricks dla programu Visual Studio Code działa tylko z katalogami obszarów roboczych, które tworzy. Nie można użyć istniejącego katalogu obszaru roboczego w projekcie, chyba że został utworzony przez rozszerzenie.

Aby przejść do widoku obszaru roboczego w usłudze Databricks, kliknij ikonę linku zewnętrznego (Otwórz link zewnętrznie) skojarzona z folderem obszaru roboczego.

Rozszerzenie określa folder obszaru roboczego usługi Azure Databricks do użycia na file_path podstawie ustawienia w workspace mapowaniu skojarzonej konfiguracji pakietu zasobów usługi Databricks projektu. Zobacz obszar roboczy.

Uwaga

Rozszerzenie usługi Databricks dla programu Visual Studio Code wykonuje tylko jednokierunkową automatyczną synchronizację zmian plików z lokalnego projektu programu Visual Studio Code z powiązanym folderem obszaru roboczego w zdalnym obszarze roboczym usługi Azure Databricks. Pliki w tym zdalnym katalogu obszaru roboczego mają być przejściowe. Nie inicjuj zmian tych plików z obszaru roboczego zdalnego, ponieważ te zmiany nie zostaną zsynchronizowane z powrotem do projektu lokalnego.

Aby uzyskać szczegółowe informacje o użyciu funkcji synchronizacji katalogu obszaru roboczego dla wcześniejszych wersji rozszerzenia usługi Databricks dla programu Visual Studio Code, zobacz Wybieranie katalogu obszarów roboczych dla rozszerzenia usługi Databricks dla programu Visual Studio Code.

Konfigurowanie środowiska języka Python i usługi Databricks Connect

Sekcja Środowisko języka Python w widoku Konfiguracja umożliwia łatwą konfigurację wirtualnego środowiska deweloperskiego języka Python i instalację programu Databricks Connect na potrzeby uruchamiania i debugowania kodu i komórek notesu. Środowiska wirtualne języka Python zapewniają, że projekt korzysta z zgodnych wersji pakietów python i Python (w tym przypadku pakietu Databricks Connect).

Aby skonfigurować środowisko wirtualne języka Python dla projektu, w widoku Konfiguracja panelu rozszerzenia:

  1. Kliknij czerwony element Aktywuj środowisko wirtualne w obszarze Środowisko języka Python.
  2. W palecie poleceń wybierz pozycję Venv lub Conda.
  3. Wybierz zależności, które chcesz zainstalować, jeśli istnieją.

Aby zmienić środowiska, kliknij ikonę koła zębatego (Zmień środowisko wirtualne) skojarzona ze środowiskiem aktywnym.

Aby uzyskać informacje na temat instalowania programu Databricks Connect, który umożliwia uruchamianie i debugowanie kodu i notesów w programie Visual Studio Code, zobacz Debugowanie kodu przy użyciu programu Databricks Connect dla rozszerzenia usługi Databricks dla programu Visual Studio Code.