다음을 통해 공유


Python용 Databricks Connect에서 JupyterLab 사용

참고 항목

이 문서에서는 Databricks Runtime 13.3 LTS 이상에 대한 Databricks Connect에 대해 설명합니다.

이 문서에서는 JupyterLab에서 Python용 Databricks Connect를 사용하는 방법을 설명합니다. Databricks Connect를 사용하면 인기 있는 Notebook 서버, IDE 및 기타 사용자 지정 애플리케이션을 Azure Databricks 클러스터에 연결할 수 있습니다. Databricks Connect란?을 참조하세요.

참고 항목

Databricks Connect 사용을 시작하기 전에 Databricks Connect 클라이언트를 설정해야 합니다.

JupyterLab 및 Python에서 Databricks Connect를 사용하려면 다음 지침을 따릅니다.

  1. Python 가상 환경이 활성화된 JupyterLab을 설치하려면 터미널 또는 명령 프롬프트에서 다음 명령을 실행합니다.

    pip3 install jupyterlab
    
  2. 웹 브라우저에서 JupyterLab을 시작하려면 활성화된 Python 가상 환경에서 다음 명령을 실행합니다.

    jupyter lab
    

    JupyterLab이 웹 브라우저에 표시되지 않는 경우 가상 환경으로 시작하거나 127.0.0.1 가상 환경에서 시작하는 URL을 localhost 복사하여 웹 브라우저의 주소 표시줄에 입력합니다.

  3. 새 Notebook 만들기: JupyterLab에서 주 메뉴에서 새 > 전자 필기장 파일을 > 클릭하고 Python 3(ipykernel)을 선택하고 선택을 클릭합니다.

  4. Notebook의 첫 번째 셀에 예제 코드 또는 사용자 고유의 코드를 입력합니다. 사용자 고유의 코드를 사용하는 경우 최소한 예제 코드표시된 대로 초기화 DatabricksSession 해야 합니다.

  5. Notebook을 실행하려면 모든 셀 실행을 > 클릭합니다. 모든 코드는 로컬로 실행되지만 DataFrame 작업과 관련된 모든 코드는 원격 Azure Databricks 작업 영역의 클러스터에서 실행되고 실행 응답은 로컬 호출자에게 다시 전송됩니다.

  6. Notebook을 디버그하려면 Notebook 도구 모음에서 Python 3(ipykernel) 옆에 있는 버그(디버거 사용) 아이콘을 클릭합니다. 하나 이상의 중단점을 설정한 다음 모든 셀 실행을 > 클릭합니다. 모든 코드는 로컬로 디버그되고 모든 Spark 코드는 원격 Azure Databricks 작업 영역의 클러스터에서 계속 실행됩니다. 코어 Spark 엔진 코드는 클라이언트에서 직접 디버그할 수 없습니다.

  7. JupyterLab을 종료하려면 파일 > 종료를 클릭합니다. JupyterLab 프로세스가 터미널 또는 명령 프롬프트에서 계속 실행 중인 경우 이 프로세스를 누른 Ctrl + c 다음 입력 y 하여 확인합니다.

자세한 디버그 지침은 디버거를 참조하세요.