Udostępnij za pośrednictwem


Uruchamianie pliku w klastrze lub pliku lub notesie jako zadania w usłudze Azure Databricks przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code

Rozszerzenie usługi Databricks dla programu Visual Studio Code umożliwia uruchamianie kodu w języku Python w klastrze lub w kodzie Języka Python, języku R, języku Scala lub notesie SQL jako zadania w usłudze Azure Databricks.

Te informacje zakładają, że masz już zainstalowane i skonfigurowano rozszerzenie usługi Databricks dla programu Visual Studio Code. Zobacz Instalowanie rozszerzenia usługi Databricks dla programu Visual Studio Code.

Uruchamianie pliku w języku Python w klastrze

Aby uruchomić plik języka Python w klastrze usługi Azure Databricks przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code, z rozszerzeniem i otwartym projektem:

  1. Otwórz plik języka Python, który chcesz uruchomić w klastrze.
  2. Wykonaj jedną z następujących czynności:
    • Na pasku tytułu edytora plików kliknij ikonę Uruchom w usłudze Databricks , a następnie kliknij pozycję Przekaż i uruchom plik.

      Przekazywanie i uruchamianie pliku z ikony

    • W widoku Eksploratora (Eksplorator widoków>) kliknij prawym przyciskiem myszy plik, a następnie wybierz polecenie Uruchom w usłudze Databricks>Upload and Run File z menu kontekstowego.

      Przekazywanie i uruchamianie pliku z menu kontekstowego

Plik jest uruchamiany w klastrze, a dane wyjściowe są dostępne w konsoli debugowania (Wyświetl > konsolę debugowania).

Uruchamianie pliku w języku Python jako zadania

Aby uruchomić plik w języku Python jako zadanie usługi Azure Databricks przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code z rozszerzeniem i otwartym projektem:

  1. Otwórz plik w języku Python, który chcesz uruchomić jako zadanie.
  2. Wykonaj jedną z następujących czynności:
    • Na pasku tytułu edytora plików kliknij ikonę Uruchom w usłudze Databricks , a następnie kliknij pozycję Uruchom plik jako przepływ pracy.

      Uruchom plik jako przepływ pracy z ikony

    • W widoku Eksploratora (Eksplorator widoków>) kliknij prawym przyciskiem myszy plik, a następnie wybierz polecenie Uruchom plik w usłudze Databricks>Uruchom jako przepływ pracy z menu kontekstowego.

      Uruchamianie pliku jako przepływu pracy z menu kontekstowego

Zostanie wyświetlona nowa karta edytora zatytułowana Databricks Job Run (Uruchamianie zadania usługi Databricks). Plik jest uruchamiany jako zadanie w obszarze roboczym, a wszystkie dane wyjściowe są drukowane w obszarze Dane wyjściowe nowej karty edytora.

Aby wyświetlić informacje o uruchomieniu zadania, kliknij link Identyfikator uruchomienia zadania na nowej karcie Edytor uruchamiania zadań usługi Databricks. Zostanie otwarty obszar roboczy, a szczegóły przebiegu zadania zostaną wyświetlone w obszarze roboczym.

Uruchamianie notesu Python, R, Scala lub SQL jako zadania

Aby uruchomić notes jako zadanie usługi Azure Databricks przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code, z rozszerzeniem i otwartym projektem:

  1. Otwórz notes, który chcesz uruchomić jako zadanie.

    Napiwek

    Aby przekształcić plik Python, R, Scala lub SQL w notes usługi Azure Databricks, dodaj komentarz # Databricks notebook source na początku pliku i dodaj komentarz # COMMAND ---------- przed każdą komórką. Aby uzyskać więcej informacji, zobacz Importowanie pliku i konwertowanie go na notes.

    Plik kodu języka Python sformatowany jako notes usługi Databricks1

  2. Wykonaj jedną z następujących czynności:

    • Na pasku tytułu edytora plików notesu kliknij ikonę Uruchom w usłudze Databricks , a następnie kliknij pozycję Uruchom plik jako przepływ pracy.

    Uwaga

    Jeśli uruchamianie w usłudze Databricks jako przepływ pracy jest niedostępne, zobacz Tworzenie niestandardowej konfiguracji uruchamiania.

    • W widoku Eksploratora (Eksplorator widoków>) kliknij prawym przyciskiem myszy plik notesu, a następnie wybierz polecenie Uruchom plik w usłudze Databricks>Uruchom plik jako przepływ pracy z menu kontekstowego.

Zostanie wyświetlona nowa karta edytora zatytułowana Databricks Job Run (Uruchamianie zadania usługi Databricks). Notes jest uruchamiany jako zadanie w obszarze roboczym. Notes i jego dane wyjściowe są wyświetlane w obszarze Dane wyjściowe nowej karty edytora.

Aby wyświetlić informacje o uruchomieniu zadania, kliknij link Identyfikator uruchomienia zadania na karcie Edytor uruchamiania zadania usługi Databricks. Zostanie otwarty obszar roboczy, a szczegóły przebiegu zadania zostaną wyświetlone w obszarze roboczym.

Tworzenie niestandardowej konfiguracji przebiegu

Niestandardowa konfiguracja uruchamiania rozszerzenia usługi Databricks dla programu Visual Studio Code umożliwia przekazywanie niestandardowych argumentów do zadania lub notesu albo tworzenie różnych ustawień uruchamiania dla różnych plików.

Aby utworzyć konfigurację uruchamiania niestandardowego, kliknij pozycję Uruchom > dodaj konfigurację z menu głównego w programie Visual Studio Code. Następnie wybierz usługę Databricks dla konfiguracji uruchamiania opartej na klastrze lub Databricks: Przepływ pracy dla konfiguracji uruchamiania opartej na zadaniach.

Na przykład następująca niestandardowa konfiguracja uruchamiania modyfikuje polecenie Uruchom plik jako przepływ pracy , aby przekazać --prod argument do zadania:

{
  "version": "0.2.0",
  "configurations": [
    {
      "type": "databricks-workflow",
      "request": "launch",
      "name": "Run on Databricks as Workflow",
      "program": "${file}",
      "parameters": {},
      "args": ["--prod"]
    }
  ]
}

Napiwek

Dodaj "databricks": true do "type": "python" konfiguracji, jeśli chcesz użyć konfiguracji języka Python, ale skorzystaj z uwierzytelniania usługi Databricks Connect, które jest częścią konfiguracji rozszerzenia.

Korzystając z niestandardowych konfiguracji uruchamiania, można również przekazać argumenty wiersza polecenia i uruchomić kod tylko przez naciśnięcie F5. Aby uzyskać więcej informacji, zobacz Uruchamianie konfiguracji w dokumentacji programu Visual Studio Code.