다음을 통해 공유


Visual Studio Code용 Databricks 확장을 사용하여 Azure Databricks에서 작업으로 클러스터 또는 파일 또는 Notebook에서 파일 실행

Visual Studio Code용 Databricks 확장을 사용하면 클러스터 또는 Python, R, Scala 또는 SQL 코드 또는 Notebook에서 Python 코드를 Azure Databricks의 작업으로 실행할 수 있습니다.

이 정보는 Visual Studio Code용 Databricks 확장을 이미 설치하고 설정했다고 가정합니다. Visual Studio Code용 Databricks 확장 설치를 참조하세요.

참고 항목

Visual Studio Code 내에서 코드 또는 Notebook을 디버그하려면 Databricks Connect를 사용합니다. Visual Studio Code용 Databricks 확장에 Databricks Connect를 사용하고 Visual Studio Code용 Databricks 확장을 사용하여 Databricks Connect를 사용하여 Databricks Connect를 사용하여 Notebook 셀 실행 및 디버그를 참조하세요.

클러스터에서 Python 파일 실행

확장 및 프로젝트가 열린 Visual Studio Code용 Databricks 확장을 사용하여 Azure Databricks 클러스터에서 Python 파일을 실행하려면 다음을 수행합니다.

  1. 클러스터에서 실행하려는 Python 파일을 엽니다.
  2. 다음 중 하나를 수행합니다.
    • 파일 편집기 제목 표시줄에서 Databricks에서 실행 아이콘을 클릭한 다음 파일 업로드 및 실행을 클릭합니다.

      아이콘에서 파일 업로드 및 실행

    • 탐색기 보기(탐색기 보기>)에서 파일을 마우스 오른쪽 단추로 클릭한 다음 상황에 맞는 메뉴에서 Databricks>

      상황에 맞는 메뉴에서 파일 업로드 및 실행

파일은 클러스터에서 실행되며 디버그 콘솔(디버그 콘솔 보기>)에서 출력을 사용할 수 있습니다.

Python 파일을 작업으로 실행

확장 및 프로젝트가 열린 Visual Studio Code용 Databricks 확장을 사용하여 Python 파일을 Azure Databricks 작업으로 실행하려면 다음을 수행합니다.

  1. 작업으로 실행하려는 Python 파일을 엽니다.
  2. 다음 중 하나를 수행합니다.
    • 파일 편집기 제목 표시줄에서 Databricks에서 실행 아이콘을 클릭한 다음 워크플로로 파일 실행을 클릭합니다.

      아이콘에서 파일을 워크플로로 실행

    • 탐색기 보기(탐색기 보기>)에서 파일을 마우스 오른쪽 단추로 클릭한 다음 상황에 맞는 메뉴에서 Databricks>

      상황에 맞는 메뉴에서 워크플로로 파일 실행

Databricks 작업 실행이라는 새 편집기 탭이 나타납니다. 파일이 작업 영역에서 작업으로 실행되고 모든 출력이 새 편집기 탭의 출력 영역에 인쇄됩니다.

작업 실행에 대한 정보를 보려면 새 Databricks 작업 실행 편집기 탭에서 작업 실행 ID 링크를 클릭합니다. 작업 영역이 열리고 작업 실행 세부 정보가 작업 영역에 표시됩니다.

Python, R, Scala 또는 SQL Notebook을 작업으로 실행

확장 및 프로젝트가 열린 Visual Studio Code용 Databricks 확장을 사용하여 Azure Databricks 작업으로 Notebook을 실행하려면 다음을 수행합니다.

  1. 작업으로 실행하려는 Notebook을 엽니다.

    Python, R, Scala 또는 SQL 파일을 Azure Databricks Notebook으로 전환하려면 파일의 시작 부분에 주석 # Databricks notebook source 을 추가하고 각 셀 앞에 주석 # COMMAND ---------- 을 추가합니다. 자세한 내용은 파일 가져와 Notebook으로 변환을 참조하세요.

    Databricks Notebook1 형식의 Python 코드 파일

  2. 다음 중 하나를 수행합니다.

    • Notebook 파일 편집기 제목 표시줄에서 Databricks에서 실행 아이콘을 클릭한 다음 워크플로로 파일 실행을 클릭합니다.

    참고 항목

    Databricks에서 워크플로로 실행할 수 없는 경우 사용자 지정 실행 구성 만들기를 참조하세요.

    • 탐색기 보기(탐색기 보기>)에서 Notebook 파일을 마우스 오른쪽 단추로 클릭한 다음 상황에 맞는 메뉴에서 Databricks>

Databricks 작업 실행이라는 새 편집기 탭이 나타납니다. Notebook은 작업 영역에서 작업으로 실행됩니다. Notebook 및 해당 출력이 새 편집기 탭의 출력 영역에 표시됩니다.

작업 실행에 대한 정보를 보려면 Databricks 작업 실행 편집기 탭에서 작업 실행 ID 링크를 클릭합니다. 작업 영역이 열리고 작업 실행 세부 정보가 작업 영역에 표시됩니다.

사용자 지정 실행 구성 만들기

Visual Studio Code용 Databricks 확장에 대한 사용자 지정 실행 구성을 사용하면 사용자 지정 인수를 작업 또는 Notebook에 전달하거나 다른 파일에 대해 다른 실행 설정을 만들 수 있습니다.

사용자 지정 실행 구성을 만들려면 Visual Studio Code의 주 메뉴에서 실행 > 구성 추가를 클릭합니다. 그런 다음, 클러스터 기반 실행 구성의 경우 Databricks를, 작업 기반 실행 구성의 경우 Databricks: 워크플로를 선택합니다.

예를 들어 다음 사용자 지정 실행 구성은 워크플로 실행 명령을 수정하여 인수를 --prod 작업에 전달합니다.

{
  "version": "0.2.0",
  "configurations": [
    {
      "type": "databricks-workflow",
      "request": "launch",
      "name": "Run on Databricks as Workflow",
      "program": "${file}",
      "parameters": {},
      "args": ["--prod"]
    }
  ]
}

Python 구성을 "databricks": true 사용하지만 확장 설정의 일부인 Databricks Connect 인증을 활용하려는 경우 구성에 추가 "type": "python" 합니다.

사용자 지정 실행 구성을 사용하여 명령줄 인수를 전달하고 F5 키를 눌러 코드를 실행할 수도 있습니다. 자세한 내용은 Visual Studio Code 설명서에서 구성 시작을 참조하세요.