Sdílet prostřednictvím


Úkol poznámkového bloku pro úlohy

Pomocí úlohy poznámkového bloku nasaďte poznámkové bloky Databricks.

Konfigurace úlohy poznámkového bloku

Než začnete, musíte mít poznámkový blok v umístění přístupném uživatelem, který úlohu konfiguruje.

Poznámka:

Uživatelské rozhraní úloh zobrazuje možnosti dynamicky na základě jiných nakonfigurovaných nastavení.

Zahájení toku pro konfiguraci Notebook úlohy:

  1. V uživatelském rozhraní Úloh přejděte na kartu Úkoly .
  2. V rozevírací nabídce TypselectNotebook.

Konfigurace zdroje

V rozevírací nabídce Zdroj vyberte select umístění skriptu Pythonu pomocí jedné z následujících možností.

Pracovní prostor

Pomocí pracovního prostoru můžete nakonfigurovat poznámkový blok uložený v pracovním prostoru provedením následujících kroků:

  1. Klikněte na pole Cesta . Zobrazí se dialog Select poznámkového bloku.
  2. Přejděte do poznámkového bloku, kliknutím zvýrazněte soubor a klikněte na Potvrdit.

Poznámka:

Tuto možnost můžete použít ke konfiguraci úlohy pro poznámkový blok uložený ve složce Git Databricks. Databricks doporučuje použít možnost poskytovatele Gitu a vzdálené úložiště Git pro správu verzí prostředků naplánovaných s úlohami.

Poskytovatel Gitu

Pomocí poskytovatele Gitu nakonfigurujte poznámkový blok ve vzdáleném úložišti Git.

Možnosti zobrazené uživatelským rozhraním závisí na tom, jestli jste už nakonfigurovali jiného poskytovatele Gitu. Pro všechny úlohy v úloze lze použít pouze jedno vzdálené úložiště Git. Viz Použití Gitu s úlohami.

Důležité

Poznámkové bloky vytvořené úlohami Azure Databricks, které běží ze vzdálených úložišť Git, jsou dočasné a nelze se spoléhat na sledování spuštění, experimentů nebo modelů MLflow. Při vytváření poznámkového bloku z úlohy použijte experiment MLflow pracovního prostoru (místo experimentu MLflow poznámkového bloku) a před spuštěním libovolného sledovacího kódu MLflow v poznámkovém bloku pracovního prostoru zavolejte mlflow.set_experiment("/path/to/experiment") do poznámkového bloku pracovního prostoru. Další podrobnosti najdete v tématu Prevence ztráty dat v experimentech MLflow.

Pole Cesta se zobrazí po nakonfigurování odkazu na Git.

Zadejte relativní cestu k poznámkovému bloku, například etl/bronze/ingest.py.

Důležité

Když zadáte relativní cestu, nezačínejte ani /nezačínejte ./ . Pokud je například absolutní cesta k poznámkovému bloku, ke které chcete získat přístup /etl/bronze/ingest.py, zadejte etl/bronze/ingest.py do pole Cesta .

Konfigurace výpočetních a závislých knihoven

  1. Použijte výpočetní do select nebo nakonfigurujte cluster, který podporuje logiku ve vašem poznámkovém bloku.
  2. Pokud používáte Serverless výpočetní úlohy, použijte políčko Prostředí a knihoven pro select, úpravu nebo přidání nového prostředí. Viz Instalace závislostí poznámkového bloku.
  3. U všech ostatních konfigurací výpočetních prostředků klikněte na + Přidat v části Závislé knihovny. Zobrazí se dialogové okno Přidat závislá knihovna .
    • Můžete select existující knihovnu nebo nahrát novou knihovnu.
    • Knihovny uložené v umístění podporovaném konfiguracemi výpočetních prostředků můžete používat jenom v umístění. Viz podpora knihovny Pythonu.
    • Každý zdroj knihovny má jiný tok pro výběr nebo nahrání knihovny. Viz knihovny.

Dokončení konfigurace úlohy

  1. (Volitelné) Nakonfigurujte Parameters jako páry klíč-hodnota, k nimž lze přistupovat v poznámkovém bloku pomocí dbutils.widgets. Viz Konfigurujte úkol parameters.
  2. Klikněte na Uložit úkol.

Omezení

Celkový výstup buněk poznámkového bloku (kombinovaný výstup všech buněk poznámkového bloku) je omezen na 20 MB limit. Navíc platí, že výstup jednotlivých buněk nesmí překročit velikost 8 MB limit. Pokud celkový výstup buňky přesahuje velikost 20 MB nebo pokud je výstup jednotlivé buňky větší než 8 MB, spuštění se zruší a označí jako neúspěšné.

Pokud potřebujete pomoc s hledáním buněk poblíž nebo nad rámec limit, spusťte poznámkový blok na univerzálním clusteru a využijte tuto techniku automatického ukládání poznámkového bloku .