Sdílet prostřednictvím


Vytvoření parametrizovaného poznámkového bloku pomocí Papermillu

Parametrizace v Nástroji Azure Data Studio spouští stejný poznámkový blok s jinou sadou parametrů.

V tomto článku se dozvíte, jak vytvořit a spustit parametrizovaný poznámkový blok v Nástroji Azure Data Studio pomocí jádra Pythonu.

Poznámka:

V současné době můžete použít parametrizaci s jádry Python, PySpark, PowerShell a .NET Interactive.

Požadavky

Instalace a nastavení papermillu v Nástroji Azure Data Studio

Všechny kroky v této části se spouštějí v poznámkovém bloku Azure Data Studio.

  1. Vytvořte nový poznámkový blok. Změna jádra na Python 3:

    Snímek obrazovky s možností nabídky Nový poznámkový blok a nastavením hodnoty jádra na Python 3

  2. Pokud se zobrazí výzva k upgradu balíčků Pythonu, když vaše balíčky potřebují aktualizaci, vyberte Ano:

    Snímek obrazovky s výzvou dialogového okna k aktualizaci balíčků Pythonu

  3. Nainstalujte papírový mlýn:

    import sys
    !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
    

    Ověřte, že je nainstalovaný papermill:

    import sys
    !{sys.executable} -m pip list
    

    Snímek obrazovky znázorňující výběr Papermill v seznamu názvů aplikací

  4. Pokud chcete ověřit, jestli je papírový mlýn správně nainstalovaný, zkontrolujte verzi papermillu:

    import papermill
    papermill
    

    Snímek obrazovky znázorňující ověření instalace pro Papermill

Příklad parametrizace

Ukázkový soubor poznámkového bloku můžete použít k procházení kroků v tomto článku:

  1. Přejděte do souboru poznámkového bloku na GitHubu. Vyberte Nezpracovaný.
  2. Vyberte Ctrl+S nebo klikněte pravým tlačítkem myši a uložte soubor s příponou .ipynb.
  3. Otevřete soubor v Nástroji Azure Data Studio.

Nastavení parametrizovaného poznámkového bloku

Můžete začít s ukázkovým poznámkovým blokem otevřeným v Azure Data Studiu nebo provedením následujících kroků vytvořte poznámkový blok. Pak zkuste použít jiné parametry. Všechny kroky se spouštějí v poznámkovém bloku Azure Data Studio.

  1. Ověřte, že je jádro nastavené na Python 3:

    Snímek obrazovky znázorňující hodnotu jádra pro Python 3

  2. Vytvořte novou buňku kódu. Vyberte Parametry a označte buňku jako buňku parametrů.

    x = 2.0
    y = 5.0
    

    Snímek obrazovky znázorňující vytvoření nové buňky parametrů s vybranou možností Parametry

  3. Přidejte další buňky pro testování různých parametrů:

    addition = x + y
    multiply = x * y
    
    print("Addition: " + str(addition))
    print("Multiplication: " + str(multiply))
    

    Po spuštění všech buněk bude výstup vypadat podobně jako v tomto příkladu:

    Snímek obrazovky znázorňující výstup buněk přidaných k otestování nových parametrů

  4. Uložte poznámkový blok jako Input.ipynb:

    Snímek obrazovky znázorňující uložení souboru poznámkového bloku

Spuštění poznámkového bloku Papermill

Papírový mlýn můžete spustit dvěma způsoby:

  • Rozhraní příkazového řádku (CLI)
  • Rozhraní API pro Python

Parametrizované spuštění rozhraní příkazového řádku

Pokud chcete spustit poznámkový blok pomocí rozhraní příkazového řádku, zadejte papermill v terminálu příkaz se vstupním poznámkovým blokem, umístěním výstupního poznámkového bloku a možnostmi.

Poznámka:

Další informace najdete v dokumentaci k rozhraní příkazového řádku PaperMill.

  1. Spusťte vstupní poznámkový blok s novými parametry:

    papermill Input.ipynb Output.ipynb -p x 10 -p y 20
    

    Tento příkaz spustí vstupní poznámkový blok s novými hodnotami parametrů x a y.

  2. Nová buňka s popiskem # Injected-Parameters obsahuje nové hodnoty parametrů, které byly předány prostřednictvím rozhraní příkazového řádku. Nové # Injected-Parameters hodnoty se používají pro nový výstup zobrazený v poslední buňce:

    Snímek obrazovky znázorňující výstup pro nové parametry

Parametrizované spouštění rozhraní PYTHON API

Poznámka:

Další informace najdete v dokumentaci k Papermill Pythonu.

  1. Vytvořte nový poznámkový blok. Změna jádra na Python 3:

    Snímek obrazovky s možností nabídky Nový poznámkový blok a nastavením hodnoty jádra na Python 3

  2. Přidejte novou buňku kódu. Pak pomocí rozhraní API Papermill Pythonu spusťte a vygenerujte výstupní parametrizovaný poznámkový blok:

    import papermill as pm
    
    pm.execute_notebook(
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb',
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb',
    parameters = dict(x = 10, y = 20)
    )
    

    Snímek obrazovky znázorňující spuštění rozhraní PYTHON API

  3. Nová buňka s popiskem # Injected-Parameters obsahuje nové hodnoty parametrů, které byly předány. Nové # Injected-Parameters hodnoty se používají pro nový výstup zobrazený v poslední buňce:

    Snímek obrazovky znázorňující výstup pro nové parametry

Další kroky

Další informace o poznámkových blocích a parametrizaci: