다음을 통해 공유


Papermill을 사용하여 매개 변수가 있는 Notebook 만들기

Azure Data Studio의 매개 변수화는 다른 매개 변수 집합을 사용하여 동일한 Notebook을 실행합니다.

이 문서는 Python 커널을 사용하여 Azure Data Studio에서 매개 변수가 있는 Notebook을 만들고 실행하는 방법을 보여줍니다.

참고 항목

현재 매개 변수화는 Python, PySpark, PowerShell, .Net 대화형 커널에서 사용할 수 있습니다.

필수 조건

Azure Data Studio에서 Papermill 설치 및 설정

이 섹션의 모든 단계는 Azure Data Studio Notebook 내에서 실행됩니다.

  1. 새 Notebook을 만듭니다. 커널Python 3으로 변경합니다.

    새 Notebook 메뉴 옵션과 커널 값을 Python 3으로 설정하는 것을 보여 주는 스크린샷

  2. 패키지를 업데이트해야 하는 경우 Python 패키지를 업그레이드하라는 프롬프트가 표시될 수 있습니다. 그러면 를 선택합니다.

    Python 패키지를 업데이트하라는 대화 상자 프롬프트를 보여 주는 스크린샷

  3. Papermill 설치:

    import sys
    !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
    

    Papermill이 설치되어 있는지 확인합니다.

    import sys
    !{sys.executable} -m pip list
    

    애플리케이션 이름 목록에서 Papermill을 선택하는 모습을 보여 주는 스크린샷

  4. Papermill이 올바르게 설치되었는지 확인하려면 Papermill의 버전을 확인합니다.

    import papermill
    papermill
    

    Papermill에 대한 설치 유효성 검사를 보여 주는 스크린샷

매개 변수화 예제

예제 Notebook 파일을 사용하여 이 문서의 단계를 진행할 수 있습니다.

  1. GitHub의 Notebook 파일로 이동합니다. 원시를 선택합니다.
  2. Ctrl+S를 선택하거나 마우스 오른쪽 단추를 클릭한 다음 파일을 .ipynb 확장명으로 저장합니다.
  3. Azure Data Studio에서 파일을 엽니다.

매개 변수화를 가진 Notebook 설정

Azure Data Studio에서 연 예제 Notebook으로 시작하거나 다음 단계를 완료하여 Notebook을 만듭니다. 그런 다음 다른 매개 변수를 사용해 보세요. 모든 단계는 Azure Data Studio Notebook 내에서 실행됩니다.

  1. 커널Python 3으로 설정되었는지 확인합니다.

    Python 3에 대한 커널 값을 보여 주는 스크린샷

  2. 새 코드 셀을 만듭니다. 매개 변수를 선택하여 셀에 매개 변수 셀로 태그를 지정합니다.

    x = 2.0
    y = 5.0
    

    매개 변수가 선택된 새 매개 변수 셀 만들기를 보여 주는 스크린샷

  3. 다른 셀을 추가하여 다른 매개 변수를 테스트합니다.

    addition = x + y
    multiply = x * y
    
    print("Addition: " + str(addition))
    print("Multiplication: " + str(multiply))
    

    모든 셀이 실행되면 출력은 다음 예제와 유사하게 표시됩니다.

    새 매개 변수를 테스트하기 위해 추가된 셀의 출력을 보여 주는 스크린샷

  4. Notebook을 Input.ipynb로 저장합니다.

    Notebook 파일을 저장하는 것을 보여 주는 스크린샷

Papermill Notebook 실행

다음 두 가지 방법으로 Papermill을 실행할 수 있습니다.

  • CLI(명령줄 인터페이스)
  • Python API

매개 변수가 있는 CLI 실행

CLI를 사용하여 Notebook을 실행하려면 터미널에서 입력 Notebook, 출력 Notebook의 위치 및 옵션을 사용하여 papermill 명령을 입력합니다.

참고 항목

자세한 내용은 Papermill CLI 설명서를 참조 하세요.

  1. 새 매개 변수를 사용하여 입력 Notebook을 실행합니다.

    papermill Input.ipynb Output.ipynb -p x 10 -p y 20
    

    이 명령은 xy 매개 변수 에 대한 새 값을 사용하여 입력 Notebook을 실행합니다.

  2. # Injected-Parameters 레이블이 지정된 새 셀에는 CLI를 통해 전달된 새 매개 변수 값이 포함됩니다. 새 값 # Injected-Parameters은 마지막 셀에 표시된 새 출력에 사용됩니다.

    새 매개 변수에 대한 출력을 보여 주는 스크린샷

매개 변수가 있는 Python API 실행

참고 항목

자세한 내용은 Papermill Python 설명서를 참조하세요.

  1. 새 Notebook을 만듭니다. 커널Python 3으로 변경합니다.

    새 Notebook 메뉴 옵션과 커널 값을 Python 3으로 설정하는 것을 보여 주는 스크린샷

  2. 새 코드 셀을 추가합니다. 그런 다음 Papermill Python API를 사용하여 매개 변수가 있는 출력 Notebook을 실행하고 생성합니다.

    import papermill as pm
    
    pm.execute_notebook(
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb',
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb',
    parameters = dict(x = 10, y = 20)
    )
    

    Python API 실행을 보여 주는 스크린샷

  3. # Injected-Parameters 레이블이 지정된 새 셀에는 전달된 새 매개 변수 값이 포함됩니다. 새 값 # Injected-Parameters은 마지막 셀에 표시된 새 출력에 사용됩니다.

    새 매개 변수에 대한 출력을 보여 주는 스크린샷

다음 단계

Notebook 및 매개 변수화에 대해 자세히 알아보세요.