Sdílet prostřednictvím


Spouštění a ladění buněk poznámkového bloku pomocí Databricks Connect pomocí rozšíření Databricks pro Visual Studio Code

Můžete spouštět a ladit poznámkové bloky, jednu buňku najednou nebo všechny buňky najednou a zobrazit výsledky v uživatelském rozhraní editoru Visual Studio Code pomocí rozšíření Databricks pro integraci nástroje Visual Studio Code Databricks Connect. Veškerý kód běží místně, zatímco veškerý kód zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět místnímu volajícímu. Veškerý kód je laděný místně, zatímco veškerý kód Sparku se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.

Poznámka:

Tato funkce funguje s Modulem Databricks Runtime 13.3 a novějším.

Pokud chcete povolit integraci Databricks Connect pro poznámkové bloky v rozšíření Databricks pro Visual Studio Code, musíte databricks Connect nainstalovat v rozšíření Databricks pro Visual Studio Code. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.

Spouštění buněk poznámkového bloku Pythonu

U poznámkových bloků s názvy souborů, které mají příponu .py , se při otevření poznámkového bloku v integrovaném vývojovém prostředí sady Visual Studio Code zobrazí v každé buňce tlačítka Spustit buňku, Spustit nad a Ladicí buňka . Při spuštění buňky se její výsledky zobrazí na samostatné kartě integrovaného vývojového prostředí (IDE). Při ladění se v laděné buňce zobrazují tlačítka Pokračovat, Zastavit a Krokovat . Při ladění buňky můžete použít funkce ladění editoru Visual Studio Code, jako je sledování stavů proměnných a zobrazení zásobníku volání a konzoly ladění.

Poznámkové bloky s názvy souborů, které mají .ipynb rozšíření, obsahují při otevření poznámkového bloku v integrovaném vývojovém prostředí editoru Visual Studio Code poznámkový blok a jeho buňky další funkce. Viz Spuštění buněk a práce s buňkami kódu v Editoru poznámkových bloků.

Další informace o formátech poznámkových bloků pro názvy souborů a .py.ipynb rozšíření najdete v tématu Export a import poznámkových bloků Databricks.

Spuštění buněk poznámky Jupyter v Pythonu

Spuštění nebo ladění poznámkového bloku Jupyter v Pythonu (.ipynb):

  1. V projektu otevřete poznámkový blok Jupyter Pythonu, který chcete spustit nebo ladit. Ujistěte se, že soubor Pythonu je ve formátu poznámkového bloku Jupyter a má příponu .ipynb.

    Tip

    Nový poznámkový blok Jupyter v Pythonu můžete vytvořit spuštěním >příkazu Create: New Jupyter Notebook z palety příkazů.

  2. Kliknutím na Spustit všechny buňky spustíte všechny buňky bez ladění, Spustit buňku spustí jednotlivou odpovídající buňku bez ladění, nebo Spustit po řádku spustí jednotlivou buňku řádek po řádku s omezeným laděním, s proměnnou values zobrazenou na panelu Jupyter (Zobrazení > Otevřít Zobrazení > Jupyter).

    Pokud chcete provést úplné ladění v jednotlivých buňkách, set zarážky a potom v nabídce vedle tlačítka Spustit klikněte na Ladit buňku.

    Po kliknutí na některou z těchto možností se může zobrazit výzva k instalaci chybějících závislostí balíčku poznámkového bloku Jupyter v Pythonu. Kliknutím ho nainstalujte.

    Další informace najdete v poznámkových blocích Jupyter v editoru VS Code.

Globální poznámkové bloky

Jsou povoleny také následující globální poznámkové bloky:

  • spark, která představuje instanci databricks.connect.DatabricksSession, je předem nakonfigurovaná tak, aby vytvořila instanci DatabricksSession získáním credentials ověřování Azure Databricks z rozšíření. Pokud DatabricksSession už je v kódu buňky poznámkového bloku vytvořena instance, použije se toto DatabricksSession nastavení. Podívejte se na příklady kódu pro Databricks Connect pro Python.

  • udf, předkonfigurováno jako alias pro pyspark.sql.functions.udf, což je alias pro uživatelem definované uživatelem Pythonu. Viz pyspark.sql.functions.udf.

  • sql, předkonfigurováno jako alias pro spark.sql. spark, jak je popsáno výše, představuje předkonfigurovanou instanci databricks.connect.DatabricksSession. Viz Spark SQL.

  • dbutils, předkonfigurovaná jako instance nástrojů Databricks, která se importuje z databricks-sdk a je inicializována získáním ověřovacího tokenu Azure Databricks credentials z rozšíření. Viz Použití nástrojů Databricks.

    Poznámka:

    Poznámkové bloky s Databricks Connect podporují jenom podmnožinu nástrojů Databricks.

    Pokud chcete povolit dbutils.widgets, musíte nejprve nainstalovat sadu Databricks SDK pro Python spuštěním následujícího příkazu v terminálu místního vývojového počítače:

    pip install 'databricks-sdk[notebook]'
    
  • display, předkonfigurováno jako alias pro předdefinovaný IPython.display.displayJupyter . Viz IPython.display.display.

  • displayHTML, předkonfigurováno jako alias pro dbruntime.display.displayHTML, což je alias pro display.HTML z ipython. Viz IPython.display.html.

Kouzelné poznámkové bloky

Jsou povoleny také následující magicky poznámkového bloku:

  • %fs, což je stejné jako volání dbutils.fs . Viz jazyky mixu.

  • %sh, který spustí příkaz pomocí magie %%script buňky na místním počítači. Tento příkaz se nespustí ve vzdáleném pracovním prostoru Azure Databricks. Viz jazyky mixu.

  • %md a %md-sandbox, který spouští magii %%markdownbuňky . Viz jazyky mixu.

  • %sql, který běží spark.sql. Viz jazyky mixu.

  • %pip, který běží pip install na místním počítači. To se nespustí pip install ve vzdáleném pracovním prostoru Azure Databricks. Viz Správa knihoven pomocí příkazů %pip.

  • %run, který spouští jiný poznámkový blok. Viz Orchestrace poznámkových bloků a modularizace kódu v poznámkových blocích.

    Poznámka:

    Pokud chcete povolit %run, musíte nejprve nainstalovat knihovnu nbformat spuštěním následujícího příkazu v terminálu místního vývojového počítače:

    pip install nbformat
    

Mezi další funkce, které jsou povolené, patří:

  • Datové rámce Sparku se převedou na datové rámce pandas, které se zobrazují ve formátu Jupyter table.

Omezení

Omezení spouštění buněk v poznámkových blocích v editoru Visual Studio Code zahrnují:

  • Poznámkové bloky magics a %r nejsou podporovány %scala a zobrazují chybu, pokud je volána. Viz jazyky mixu.
  • Magické %sql poznámkového bloku nepodporuje některé příkazy DML, například Zobrazit Tables.