Python용 Databricks Connect에서 Visual Studio Code 사용
참고 항목
이 문서에서는 Databricks Runtime 13.3 LTS 이상에 대한 Databricks Connect에 대해 설명합니다.
이 문서에서는 Visual Studio Code에서 Python용 Databricks Connect를 사용하는 방법을 설명합니다. Databricks Connect를 사용하면 인기 있는 IDE, Notebook 서버 및 기타 사용자 지정 애플리케이션을 Azure Databricks 클러스터에 연결할 수 있습니다. Databricks Connect란?을 참조하세요. 이 문서의 Scala 버전은 Databricks Connect for Scala에서 Visual Studio Code 사용을 참조하세요.
참고 항목
Databricks Connect 사용을 시작하기 전에 Databricks Connect 클라이언트를 설정해야 합니다.
팁
Visual Studio Code용 Databricks 확장은 Databricks Runtime 13.3 LTS 이상에 대한 Databricks Connect를 이미 기본적으로 지원합니다. Visual Studio Code용 Databricks 확장에 Databricks Connect를 사용하는 디버그 코드를 참조하세요.
Visual Studio Code 및 Python에서 Databricks Connect를 사용하려면 다음 지침을 따릅니다.
Visual Studio Code 시작
Python 가상 환경(파일 > 열기 폴더)이 포함된 폴더를 엽니다.
Visual Studio Code 터미널(터미널 보기>)에서 가상 환경을 활성화합니다.
현재 Python 인터프리터를 가상 환경에서 참조되는 인터프리터로 설정합니다.
- 명령 팔레트(명령 팔레트 보기)에서 > 입력
Python: Select Interpreter
한 다음 Enter 키를 누릅니다. - 가상 환경에서 참조되는 Python 인터프리터의 경로를 선택합니다.
- 명령 팔레트(명령 팔레트 보기)에서 > 입력
예제 코드 또는 사용자 고유의 코드가 포함된 Python 코드(
.py
) 파일을 폴더에 추가합니다. 사용자 고유의 코드를 사용하는 경우 최소한 예제 코드에 표시된 대로 초기화DatabricksSession
해야 합니다.코드를 실행하려면 주 메뉴에서 디버깅하지 않고 실행 실행을 > 클릭합니다. 모든 Python 코드는 로컬로 실행되지만 DataFrame 작업과 관련된 모든 PySpark 코드는 원격 Azure Databricks 작업 영역의 클러스터에서 실행되고 실행 응답은 로컬 호출자에게 다시 전송됩니다.
코드를 디버그하려면 다음을 수행합니다.
- Python 코드 파일이 열려 있는 상태에서 실행하는 동안 코드를 일시 중지할 중단점을 설정합니다.
- 사이드바에서 실행 및 디버그 아이콘을 클릭하거나 주 메뉴에서 실행 보기를 > 클릭합니다.
- 실행 및 디버그 보기에서 실행 및 디버그 단추를 클릭합니다.
- 화면의 지침에 따라 코드 실행 및 디버깅을 시작합니다.
모든 Python 코드는 로컬로 디버그되지만 모든 PySpark 코드는 원격 Azure Databricks 작업 영역의 클러스터에서 계속 실행됩니다. 코어 Spark 엔진 코드는 클라이언트에서 직접 디버그할 수 없습니다.
보다 구체적인 실행 및 디버그 지침은 VS Code에서 디버거 및 Python 디버깅 구성 및 실행을 참조하세요.