다음을 통해 공유


Python용 Databricks Connect에서 Visual Studio Code 사용

참고 항목

이 문서에서는 Databricks Runtime 13.3 LTS 이상에 대한 Databricks Connect에 대해 설명합니다.

이 문서에서는 Visual Studio Code에서 Python용 Databricks Connect를 사용하는 방법을 설명합니다. Databricks Connect를 사용하면 인기 있는 IDE, Notebook 서버 및 기타 사용자 지정 애플리케이션을 Azure Databricks 클러스터에 연결할 수 있습니다. Databricks Connect란?을 참조하세요. 이 문서의 Scala 버전은 Databricks Connect for Scala에서 Visual Studio Code 사용을 참조하세요.

참고 항목

Databricks Connect 사용을 시작하기 전에 Databricks Connect 클라이언트를 설정해야 합니다.

Visual Studio Code용 Databricks 확장은 Databricks Runtime 13.3 LTS 이상에 대한 Databricks Connect를 이미 기본적으로 지원합니다. Visual Studio Code용 Databricks 확장에 Databricks Connect를 사용하는 디버그 코드를 참조하세요.

Visual Studio Code 및 Python에서 Databricks Connect를 사용하려면 다음 지침을 따릅니다.

  1. Visual Studio Code 시작

  2. Python 가상 환경(파일 > 열기 폴더)이 포함된 폴더를 엽니다.

  3. Visual Studio Code 터미널(터미널 보기>)에서 가상 환경을 활성화합니다.

  4. 현재 Python 인터프리터를 가상 환경에서 참조되는 인터프리터로 설정합니다.

    1. 명령 팔레트(명령 팔레트 보기)에서 > 입력Python: Select Interpreter한 다음 Enter 키를 누릅니다.
    2. 가상 환경에서 참조되는 Python 인터프리터의 경로를 선택합니다.
  5. 예제 코드 또는 사용자 고유의 코드가 포함된 Python 코드(.py) 파일을 폴더에 추가합니다. 사용자 고유의 코드를 사용하는 경우 최소한 예제 코드표시된 대로 초기화 DatabricksSession 해야 합니다.

  6. 코드를 실행하려면 주 메뉴에서 디버깅하지 않고 실행 실행을 > 클릭합니다. 모든 Python 코드는 로컬로 실행되지만 DataFrame 작업과 관련된 모든 PySpark 코드는 원격 Azure Databricks 작업 영역의 클러스터에서 실행되고 실행 응답은 로컬 호출자에게 다시 전송됩니다.

  7. 코드를 디버그하려면 다음을 수행합니다.

    1. Python 코드 파일이 열려 있는 상태에서 실행하는 동안 코드를 일시 중지할 중단점을 설정합니다.
    2. 사이드바에서 실행 및 디버그 아이콘을 클릭하거나 주 메뉴에서 실행 보기를 > 클릭합니다.
    3. 실행 및 디버그 보기에서 실행 및 디버그 단추를 클릭합니다.
    4. 화면의 지침에 따라 코드 실행 및 디버깅을 시작합니다.

    모든 Python 코드는 로컬로 디버그되지만 모든 PySpark 코드는 원격 Azure Databricks 작업 영역의 클러스터에서 계속 실행됩니다. 코어 Spark 엔진 코드는 클라이언트에서 직접 디버그할 수 없습니다.

보다 구체적인 실행 및 디버그 지침은 VS Code에서 디버거 및 Python 디버깅 구성 및 실행을 참조하세요.