작업에 대한 Notebook 태스크를 참조하세요.
Notebook 작업을 사용하여 Databricks Notebook을 배포합니다.
Notebook 작업 구성
시작하기 전에 사용자가 작업을 구성하여 액세스할 수 있는 위치에 전자 필기장이 있어야 합니다.
참고 항목
작업 UI는 구성된 다른 설정에 따라 옵션을 동적으로 표시합니다.
Notebook
작업을 구성하는 흐름을 시작하려면 다음을 수행합니다.
- 작업 UI의 작업 탭으로 이동합니다.
-
유형 드롭다운 메뉴에서
Notebook
을 선택합니다.
원본 구성
원본 드롭다운 메뉴에서 다음 옵션 중 하나를 사용하여 Python 스크립트의 위치를 선택합니다.
작업 영역
작업 영역을 사용하여 다음 단계를 완료하여 작업 영역에 저장된 Notebook을 구성합니다.
- 경로 필드를 클릭합니다. Notebook 선택 대화 상자가 나타납니다.
- 전자 필기장을 찾아 파일을 강조 표시하려면 클릭한 다음 확인을 클릭합니다.
참고 항목
이 옵션을 사용하여 Databricks Git 폴더에 저장된 Notebook에 대한 작업을 구성할 수 있습니다. Databricks는 작업으로 예약된 자산의 버전 관리를 위해 Git 공급자 옵션 및 원격 Git 리포지토리를 사용하는 것이 좋습니다.
Git 공급자
Git 공급자를 사용하여 원격 Git 리포지토리에서 Notebook을 구성합니다.
UI에서 표시하는 옵션은 다른 곳에서 Git 공급자를 이미 구성했는지 여부에 따라 달라집니다. 하나의 원격 Git 리포지토리만 작업의 모든 작업에 사용할 수 있습니다. 작업에서 Git 사용을 참조하세요.
Important
원격 Git 리포지토리에서 실행되는 Azure Databricks 작업에서 만든 Notebook은 임시이며 MLflow 실행, 실험 또는 모델을 추적하는 데 의존할 수 없습니다. 작업에서 Notebook을 만들 때 MLflow 추적 코드를 실행하기 전에 작업 영역 MLflow 실험 대신 작업 영역 MLflow 실험을 사용하고 작업 영역 Notebook에서 mlflow.set_experiment("/path/to/experiment")
를 호출합니다. 자세한 내용은 MLflow 실험에서 데이터 손실 방지를 참조하세요.
Git 참조를 구성한 후에 경로 필드가 나타납니다.
전자 필기장에 대한 상대 경로(예: etl/bronze/ingest.py
)를 입력합니다.
Important
상대 경로를 입력할 때 /
또는 ./
로 시작하지 마세요. 예를 들어 액세스하려는 Notebook의 절대 경로가 /etl/bronze/ingest.py
인 경우 etl/bronze/ingest.py
필드에 를 입력합니다.
컴퓨팅 및 종속 라이브러리 구성
- 컴퓨팅을 사용하여 Notebook에서 논리를 지원하는 클러스터를 선택하거나 구성합니다.
-
Serverless
컴퓨팅을 사용하는 경우, 환경 및 라이브러리 필드를 사용하여 새 환경을 선택, 편집, 추가합니다. Notebook 종속성 설치를 참조하세요. - 다른 모든 컴퓨팅 구성의 경우 종속 라이브러리에서 + 추가를 클릭합니다.
종속 라이브러리 추가 대화 상자가 나타납니다.
- 기존 라이브러리를 선택하거나 새 라이브러리를 업로드할 수 있습니다.
- 컴퓨팅 구성에서 지원하는 위치에 저장된 라이브러리만 사용할 수 있습니다. Python 라이브러리 지원을 참조하세요.
- 각 라이브러리 원본에는 라이브러리를 선택하거나 업로드하기 위한 다른 흐름이 있습니다. 라이브러리를 참조하세요.
작업 구성 완료
- (선택 사항) 를 사용하여 Notebook에서 액세스할 수 있는 키-값 쌍으로
dbutils.widgets
를 구성합니다. 태스크 매개 변수 구성을 참조하세요. - 작업 저장을 클릭합니다.
제한 사항
총 Notebook 셀 출력(모든 Notebook 셀의 결합된 출력)에는 20MB 크기 제한이 적용됩니다. 또한 개별 셀 출력에는 8MB 크기 제한이 적용됩니다. 총 셀 출력 크기가 20MB를 초과하거나 개별 셀의 출력이 8MB보다 크면 실행이 취소되고 '실패'로 표시됩니다.
제한에 가깝거나 이를 초과하는 셀을 찾는 데 도움이 필요한 경우 다목적 클러스터에 대해 Notebook을 실행하고 이 Notebook 자동 저장 기술을 사용합니다.