다음을 통해 공유


작업에 대한 Python 스크립트 태스크

Python 스크립트 태스크를 사용하여 Python 파일을 실행합니다.

Python 스크립트 작업 구성

시작하기 전에 작업을 구성하는 사용자가 액세스할 수 있는 위치에 Python 스크립트를 업로드해야 합니다. Databricks는 Python 스크립트에 작업 영역 파일을 사용하는 것이 좋습니다. 작업 영역 파일이란?을 참조하세요.

참고 항목

작업 UI는 구성된 다른 설정에 따라 옵션을 동적으로 표시합니다.

Databricks는 DBFS 루트 또는 탑재를 사용하여 코드 또는 데이터를 저장하지 않도록 권장합니다. 대신 Python 스크립트를 작업 영역 파일 또는 볼륨으로 마이그레이션하거나 URI를 사용하여 클라우드 개체 스토리지에 액세스할 수 있습니다.

Python script 작업을 구성하는 흐름을 시작하려면 다음을 수행합니다.

  1. 작업 UI의 작업 탭으로 이동합니다.
  2. 유형 드롭다운 메뉴에서 Python script선택합니다.

원본 구성

원본 드롭다운 메뉴에서 다음 옵션 중 하나를 사용하여 Python 스크립트의 위치를 선택합니다.

작업 영역

작업 영역을 사용하여 작업 영역 파일을 사용하여 저장된 Python 스크립트를 구성합니다.

  1. 경로 필드를 클릭합니다. Python 파일 선택 대화 상자가 나타납니다.
  2. Python 스크립트로 이동하고 파일을 강조 표시하려면 클릭한 다음 확인을 클릭합니다.

참고 항목

이 옵션을 사용하여 Databricks Git 폴더에 저장된 Python 스크립트에서 작업을 구성할 수 있습니다. Databricks는 Git 공급자 옵션 및 원격 Git 리포지토리를 사용하여 작업으로 예약된 자산의 버전을 지정하는 것이 좋습니다.

DBFS/ADLS

DBFS/ADLS를 사용하여 볼륨, 클라우드 개체 스토리지 위치 또는 DBFS 루트에 저장된 Python 스크립트를 구성합니다.

Databricks는 Unity 카탈로그 볼륨 또는 클라우드 개체 스토리지에 Python 스크립트를 저장하는 것이 좋습니다.

경로 필드에 Python 스크립트에 대한 URI를 입력합니다. 예를 들어 /Volumes/path/to/script.py 또는 abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py입니다.

Git 공급자

Git 공급자를 사용하여 원격 Git 리포지토리에 저장된 Python 스크립트를 구성합니다.

UI에서 표시하는 옵션은 다른 곳에서 Git 공급자를 이미 구성했는지 여부에 따라 달라집니다. 하나의 원격 Git 리포지토리만 작업의 모든 작업에 사용할 수 있습니다. 작업에서 Git 사용을 참조하세요.

Git 참조를 구성한 후에 경로 필드가 나타납니다.

Python 스크립트의 상대 경로(예: etl/bronze/ingest.py)를 입력합니다.

Important

상대 경로를 입력할 때 / 또는 ./로 시작하지 마세요. 예를 들어 액세스하려는 Python 코드의 절대 경로가 /etl/bronze/ingest.py인 경우 etl/bronze/ingest.py 필드에 을 입력합니다.

컴퓨팅 및 종속 라이브러리 구성

  1. Compute 사용하여 스크립트에서 논리를 지원하는 클러스터를 선택하거나 구성합니다.
  2. Serverless 컴퓨팅을 사용하는 경우 환경 및 라이브러리 필드를 사용하여 새 환경을 선택, 편집 또는 추가합니다. Notebook 종속성 설치를 참조하세요.
  3. 다른 모든 컴퓨팅 구성의 경우 종속 라이브러리에서 + 추가를 클릭합니다. 종속 라이브러리 추가 대화 상자가 나타납니다.
    • 기존 라이브러리를 선택하거나 새 라이브러리를 업로드할 수 있습니다.
    • 컴퓨팅 구성에서 지원하는 위치에 저장된 라이브러리만 사용할 수 있습니다. Python 라이브러리 지원을 참조하세요.
    • 라이브러리 원본에는 라이브러리를 선택하거나 업로드하기 위한 다른 흐름이 있습니다. 라이브러리를 참조하세요.

작업 구성 완료

  1. (선택 사항) 매개 변수 Python 스크립트에 CLI 인수로 전달되는 문자열 목록으로 구성합니다. 작업 매개 변수구성을 참조하세요.
  2. 작업 저장을 클릭합니다.