Spouštění a ladění buněk poznámkového bloku pomocí Databricks Connect pomocí rozšíření Databricks pro Visual Studio Code
Můžete spouštět a ladit poznámkové bloky, jednu buňku najednou nebo všechny buňky najednou a zobrazit výsledky v uživatelském rozhraní editoru Visual Studio Code pomocí rozšíření Databricks pro integraci nástroje Visual Studio Code Databricks Connect. Veškerý kód běží místně, zatímco veškerý kód zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět místnímu volajícímu. Veškerý kód je laděný místně, zatímco veškerý kód Sparku se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.
Poznámka:
Tato funkce funguje s Modulem Databricks Runtime 13.3 a novějším.
Pokud chcete povolit integraci Databricks Connect pro poznámkové bloky v rozšíření Databricks pro Visual Studio Code, musíte databricks Connect nainstalovat v rozšíření Databricks pro Visual Studio Code. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.
Spouštění buněk poznámkového bloku Pythonu
U poznámkových bloků s názvy souborů, které mají příponu .py
, se při otevření poznámkového bloku v integrovaném vývojovém prostředí sady Visual Studio Code zobrazí v každé buňce tlačítka Spustit buňku, Spustit nad a Ladicí buňka . Při spuštění buňky se její výsledky zobrazí na samostatné kartě integrovaného vývojového prostředí (IDE). Při ladění se v laděné buňce zobrazují tlačítka Pokračovat, Zastavit a Krokovat . Při ladění buňky můžete použít funkce ladění editoru Visual Studio Code, jako je sledování stavů proměnných a zobrazení zásobníku volání a konzoly ladění.
Poznámkové bloky s názvy souborů, které mají .ipynb
rozšíření, obsahují při otevření poznámkového bloku v integrovaném vývojovém prostředí editoru Visual Studio Code poznámkový blok a jeho buňky další funkce. Viz Spuštění buněk a práce s buňkami kódu v Editoru poznámkových bloků.
Další informace o formátech poznámkových bloků pro názvy souborů a .py
.ipynb
rozšíření najdete v tématu Export a import poznámkových bloků Databricks.
Spuštění buněk poznámky Jupyter v Pythonu
Spuštění nebo ladění poznámkového bloku Jupyter v Pythonu (.ipynb
):
V projektu otevřete poznámkový blok Jupyter Pythonu, který chcete spustit nebo ladit. Ujistěte se, že soubor Pythonu je ve formátu poznámkového bloku Jupyter a má příponu
.ipynb
.Tip
Nový poznámkový blok Jupyter v Pythonu můžete vytvořit spuštěním >příkazu Create: New Jupyter Notebook z palety příkazů.
Kliknutím na Spustit všechny buňky spustíte všechny buňky bez ladění, Spustit buňku spustí jednotlivou odpovídající buňku bez ladění, nebo Spustit po řádku spustí jednotlivou buňku řádek po řádku s omezeným laděním, s proměnnou values zobrazenou na panelu Jupyter (Zobrazení > Otevřít Zobrazení > Jupyter).
Pokud chcete provést úplné ladění v jednotlivých buňkách, set zarážky a potom v nabídce vedle tlačítka Spustit klikněte na Ladit buňku.
Po kliknutí na některou z těchto možností se může zobrazit výzva k instalaci chybějících závislostí balíčku poznámkového bloku Jupyter v Pythonu. Kliknutím ho nainstalujte.
Další informace najdete v poznámkových blocích Jupyter v editoru VS Code.
Globální poznámkové bloky
Jsou povoleny také následující globální poznámkové bloky:
spark
, která představuje instancidatabricks.connect.DatabricksSession
, je předem nakonfigurovaná tak, aby vytvořila instanciDatabricksSession
získáním credentials ověřování Azure Databricks z rozšíření. PokudDatabricksSession
už je v kódu buňky poznámkového bloku vytvořena instance, použije se totoDatabricksSession
nastavení. Podívejte se na příklady kódu pro Databricks Connect pro Python.udf
, předkonfigurováno jako alias propyspark.sql.functions.udf
, což je alias pro uživatelem definované uživatelem Pythonu. Viz pyspark.sql.functions.udf.sql
, předkonfigurováno jako alias prospark.sql
.spark
, jak je popsáno výše, představuje předkonfigurovanou instancidatabricks.connect.DatabricksSession
. Viz Spark SQL.dbutils
, předkonfigurovaná jako instance nástrojů Databricks, která se importuje zdatabricks-sdk
a je inicializována získáním ověřovacího tokenu Azure Databricks credentials z rozšíření. Viz Použití nástrojů Databricks.Poznámka:
Poznámkové bloky s Databricks Connect podporují jenom podmnožinu nástrojů Databricks.
Pokud chcete povolit
dbutils.widgets
, musíte nejprve nainstalovat sadu Databricks SDK pro Python spuštěním následujícího příkazu v terminálu místního vývojového počítače:pip install 'databricks-sdk[notebook]'
display
, předkonfigurováno jako alias pro předdefinovanýIPython.display.display
Jupyter . Viz IPython.display.display.displayHTML
, předkonfigurováno jako alias prodbruntime.display.displayHTML
, což je alias prodisplay.HTML
zipython
. Viz IPython.display.html.
Kouzelné poznámkové bloky
Jsou povoleny také následující magicky poznámkového bloku:
%fs
, což je stejné jako volánídbutils.fs
. Viz jazyky mixu.%sh
, který spustí příkaz pomocí magie%%script
buňky na místním počítači. Tento příkaz se nespustí ve vzdáleném pracovním prostoru Azure Databricks. Viz jazyky mixu.%md
a%md-sandbox
, který spouští magii%%markdown
buňky . Viz jazyky mixu.%sql
, který běžíspark.sql
. Viz jazyky mixu.%pip
, který běžípip install
na místním počítači. To se nespustípip install
ve vzdáleném pracovním prostoru Azure Databricks. Viz Správa knihoven pomocí příkazů %pip.%run
, který spouští jiný poznámkový blok. Viz Orchestrace poznámkových bloků a modularizace kódu v poznámkových blocích.Poznámka:
Pokud chcete povolit
%run
, musíte nejprve nainstalovat knihovnu nbformat spuštěním následujícího příkazu v terminálu místního vývojového počítače:pip install nbformat
Mezi další funkce, které jsou povolené, patří:
- Datové rámce Sparku se převedou na datové rámce pandas, které se zobrazují ve formátu Jupyter table.
Omezení
Omezení spouštění buněk v poznámkových blocích v editoru Visual Studio Code zahrnují:
- Poznámkové bloky magics a
%r
nejsou podporovány%scala
a zobrazují chybu, pokud je volána. Viz jazyky mixu. - Magické
%sql
poznámkového bloku nepodporuje některé příkazy DML, například Zobrazit Tables.