Použití klasického poznámkového bloku Jupyter s Databricks Connect pro Python
Poznámka:
Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.
Tento článek popisuje, jak používat Databricks Connect pro Python s klasickým poznámkovým blokem Jupyter. Databricks Connect umožňuje připojit oblíbené servery poznámkových bloků, prostředí IDE a další vlastní aplikace ke clusterům Azure Databricks. Podívejte se, co je Databricks Connect?
Poznámka:
Než začnete používat Databricks Connect, musíte nastavit klienta Databricks Connect.
Pokud chcete používat Databricks Connect s klasickým poznámkovým blokem Jupyter a Pythonem, postupujte podle těchto pokynů.
Pokud chcete nainstalovat klasický Jupyter Notebook, aktivované virtuální prostředí Pythonu, spusťte z terminálu nebo příkazového řádku následující příkaz:
pip3 install notebook
Pokud chcete spustit klasický jupyter Notebook ve webovém prohlížeči, spusťte z aktivovaného virtuálního prostředí Pythonu následující příkaz:
jupyter notebook
Pokud se klasický poznámkový blok Jupyter ve webovém prohlížeči nezobrazuje, zkopírujte adresu URL, která začíná vaším virtuálním prostředím
localhost
,127.0.0.1
a zadejte ji do adresního řádku webového prohlížeče.Vytvořte nový poznámkový blok: v klasickém Poznámkovém bloku Jupyter klikněte na kartě Soubory na Nový > Python 3 (ipykernel).
Do první buňky poznámkového bloku zadejte ukázkový kód nebo vlastní kód. Pokud používáte vlastní kód, musíte minimálně inicializovat
DatabricksSession
, jak je znázorněno v ukázkovém kódu.Pokud chcete poznámkový blok spustit, klikněte na > v buňce. Veškerý kód Pythonu běží místně, zatímco veškerý kód PySpark zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět do místního volajícího.
Pokud chcete poznámkový blok ladit, přidejte na začátek poznámkového bloku následující řádek kódu:
from IPython.core.debugger import set_trace
Potom voláním
set_trace()
zadejte příkazy ladění v tomto okamžiku provádění poznámkového bloku. Veškerý kód Pythonu je laděný místně, zatímco veškerý kód PySpark se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.Pokud chcete klasický poznámkový blok Jupyter Vypnout, klikněte na > Tlačítko Zavřít a Zastavit soubor. Pokud klasický proces Jupyter Notebook stále běží v terminálu nebo příkazovém řádku, ukončete tento proces stisknutím
Ctrl + c
a zadáním potvrďtey
.