Visual Studio Code용 Databricks 확장은 무엇입니까?
Visual Studio Code용 Databricks 확장을 사용하면 로컬 개발 머신에서 실행되는 Visual Studio Code IDE(통합 개발 환경)에서 원격 Azure Databricks 작업 영역에 연결할 수 있습니다. 그러면 다음을 수행할 수 있습니다.
- Databricks 자산 번들을 정의, 배포 및 실행하여 Visual Studio Code UI를 사용하여 Azure Databricks 작업, 델타 라이브 테이블 파이프라인 및 MLOps 스택에 CI/CD 패턴 및 모범 사례를 적용합니다. Databricks 자산 번들이란? 및 Databricks 자산 번들 확장 기능을 참조하세요.
- 원격 작업 영역의 Azure Databricks 클러스터에서 Visual Studio Code의 로컬 Python 코드 파일을 실행합니다. 클러스터에서 Python 파일 실행 보기
- 원격 작업 영역에서 Visual Studio Code의 로컬 Python 코드 파일(
.py
) 및 Python, R, Scala, SQL Notebook(.py
,.ipynb
,.r
,.scala
,.sql
)을 Azure Databricks 작업으로 실행합니다. Python 파일을 작업으로 실행을 참조하세요. - 선택 대화 상자를 트리거하는 간단한 검사 목록을 사용하여 디버깅 환경 및 Databricks Connect를 설정하고 구성합니다. Visual Studio Code용 Databricks 확장에 Databricks Connect를 사용하는 디버그 코드를 참조하세요.
- Databricks Connect를 사용하여 Visual Studio Code 내의 셀별로 Notebook 셀을 디버그합니다. Visual Studio Code용 Databricks 확장을 사용하여 Databricks Connect로 Notebook 셀 실행 및 디버그를 참조하세요.
- Visual Studio Code로 개발한 로컬 코드를 원격 작업 영역의 코드와 동기화합니다.
참고 항목
Visual Studio Code용 Databricks 확장은 R, Scala 및 SQL Notebook을 자동화된 작업으로 실행할 수 있도록 지원하지만 Visual Studio Code 내에서 이러한 언어를 더 자세히 지원하지는 않습니다.
시작하기
Visual Studio Code용 Databricks 확장을 사용하여 시작하려면:
- 익스텐션을 설치합니다.
- 새 Databricks 프로젝트를 만들거나 기존 Visual Studio Code 프로젝트를 마이그레이션합니다.
- Databricks 확장 UI를 사용하여 프로젝트를 쉽게 구성합니다.
- 확장 자습서의 일부로 Python 코드를 실행합니다.
- Databricks Connect 통합을 사용하여 코드를 디버그합니다.
pytest
를 사용하여 코드를 테스트합니다. Visual Studio Code용 Databricks 확장을 사용하여 pytest로 테스트 실행을 참조하세요.
새 Databricks 프로젝트 만들기
확장이 설치되면 Visual Studio Code용 Databricks 확장을 사용하여 새 Databricks 프로젝트를 만들 수 있습니다.
- Visual Studio Code를 시작합니다.
- Visual Studio Code 사이드바에서 확장을 열고 Databricks 아이콘을 클릭합니다.
- 새 Databricks 프로젝트 만들기를 클릭합니다.
- 명령 팔레트에서 프로젝트에 대한 호스트 및 인증 방법을 선택합니다. Visual Studio Code용 Databricks 확장에 대한 인증 설정을 참조하세요.
- 새 프로젝트를 만들 폴더에 대한 경로 제공에서 프로젝트를 만들려는 로컬 개발 컴퓨터의 폴더 경로를 입력하거나 폴더 선택 열기 대화 상자를 클릭하고 프로젝트 폴더의 경로를 선택합니다.
- Databricks 프로젝트 초기화 보기에서 사용할 템플릿의 경우 위쪽 및 아래쪽 화살표를 사용하여 프로젝트 템플릿을 선택한 다음 Enter 키를 누릅니다. 번들 프로젝트 템플릿에 대한 자세한 내용은 Databricks 자산 번들 프로젝트 템플릿을 참조하세요.
- 프로젝트에 대한 이 프로젝트용 고유 이름을 입력하거나 기본 프로젝트 이름
my_project
를 그대로 두고 Enter 키를 누릅니다. - 스텁(샘플) Notebook, 스텁(샘플) Delta Live Tables 파이프라인 또는 스텁(샘플) Python 패키지를 프로젝트에 추가할지 또는 이러한 스텁(샘플)의 조합을 추가할지 선택합니다.
- 아무 키나 눌러 Databricks Project Init 편집기 탭을 닫습니다.
- 열려는 프로젝트를 선택하려면 방금 만든 프로젝트를 선택합니다.
Databricks 프로젝트로 프로젝트 마이그레이션
Databricks 프로젝트로 마이그레이션하려는 기존 프로젝트가 있는 경우 Visual Studio Code용 Databricks 확장을 사용하여 열어서 마이그레이션을 시작합니다.
- Visual Studio Code를 시작합니다. 주 메뉴에서 파일>폴더 열기를 클릭하고 폴더를 열 프로젝트로 이동합니다.
- Visual Studio Code 사이드바에서 확장을 열고 Databricks 아이콘을 클릭합니다.
- Databricks 프로젝트로 마이그레이션을 클릭합니다.
- 명령 팔레트에서 프로젝트에 대한 호스트 및 인증 방법을 선택합니다. Visual Studio Code용 Databricks 확장에 대한 인증 설정을 참조하세요.
참고 항목
Visual Studio Code v1용 Databricks 확장을 사용하여 만든 프로젝트를 열면 프로젝트의 기존 인증 및 작업 영역 구성을 사용하여 마이그레이션이 자동으로 시도됩니다. 마이그레이션 버튼은 자동 마이그레이션이 실패하는 경우에만 사용할 수 있습니다.
기존 Databricks 자산 번들 프로젝트 열기
Visual Studio Code용 Databricks 확장이 현재 폴더에서 둘 이상의 Databricks 자산 번들 프로젝트를 검색하는 경우 Visual Studio Code용 Databricks 확장을 사용하면 열 프로젝트를 선택할 수 있습니다.
참고 항목
Databricks 자산 번들 프로젝트에는 프로젝트의 루트 폴더에 databricks.yml
파일이 있습니다. Databricks 자산 번들 구성을 참조하세요.
Visual Studio Code를 시작합니다. 주 메뉴에서 파일>폴더 열기를 클릭하고 번들 프로젝트가 포함된 디렉터리로 이동합니다.
Visual Studio Code 사이드바에서 확장을 열고 Databricks 아이콘을 클릭합니다.
기존 Databricks 프로젝트 열기를 클릭합니다.
명령 팔레트에서 기존 Databricks 자산 번들 프로젝트를 선택합니다.
명령 팔레트에서 프로젝트에 대한 호스트 및 인증 방법을 선택합니다. Visual Studio Code용 Databricks 확장에 대한 인증 설정을 참조하세요.
작업 영역에 다른 Databricks 프로젝트 추가
Visual Studio Code용 Databricks 확장을 사용하면 Visual Studio Code 작업 영역 내에 여러 Databricks 프로젝트를 포함할 수 있으며 이러한 프로젝트 간에 쉽게 전환할 수 있습니다. 다른 프로젝트를 추가하려면:
Visual Studio Code를 시작합니다. 주 메뉴에서 파일>작업 영역에 폴더 추가를 클릭하고 다른 번들 프로젝트가 포함된 디렉터리로 이동합니다.
Visual Studio Code 사이드바에서 확장을 열고 Databricks 아이콘을 클릭합니다.
활성 작업 영역 폴더를 클릭하여 사용할 확장 프로젝트를 선택합니다.