Sdílet prostřednictvím


Úkol poznámkového bloku pro úlohy

Pomocí úlohy poznámkového bloku nasaďte poznámkové bloky Databricks.

Konfigurace úlohy poznámkového bloku

Než začnete, musíte mít poznámkový blok v umístění přístupném uživatelem, který úlohu konfiguruje.

Poznámka:

Uživatelské rozhraní úloh zobrazuje možnosti dynamicky na základě jiných nakonfigurovaných nastavení.

Zahájení toku pro konfiguraci Notebook úlohy:

  1. V uživatelském rozhraní Úloh přejděte na kartu Úkoly .
  2. V rozevírací nabídce Typ vyberte Notebook.

Konfigurace zdroje

V rozevírací nabídce Zdroj vyberte umístění skriptu Pythonu pomocí jedné z následujících možností.

Pracovní prostor

Pomocí pracovního prostoru můžete nakonfigurovat poznámkový blok uložený v pracovním prostoru provedením následujících kroků:

  1. Klikněte na pole Cesta . Zobrazí se dialogové okno Výběr poznámkového bloku.
  2. Přejděte do poznámkového bloku, kliknutím zvýrazněte soubor a klikněte na Potvrdit.

Poznámka:

Tuto možnost můžete použít ke konfiguraci úlohy pro poznámkový blok uložený ve složce Git Databricks. Databricks doporučuje použít možnost poskytovatele Gitu a vzdálené úložiště Git pro správu verzí prostředků naplánovaných s úlohami.

Poskytovatel Gitu

Pomocí poskytovatele Gitu nakonfigurujte poznámkový blok ve vzdáleném úložišti Git.

Možnosti zobrazené uživatelským rozhraním závisí na tom, jestli jste už nakonfigurovali jiného poskytovatele Gitu. Pro všechny úlohy v úloze lze použít pouze jedno vzdálené úložiště Git. Viz Použití Gitu s úlohami.

Důležité

Poznámkové bloky vytvořené úlohami Azure Databricks, které běží ze vzdálených úložišť Git, jsou dočasné a nelze se spoléhat na sledování spuštění, experimentů nebo modelů MLflow. Při vytváření poznámkového bloku z úlohy použijte experiment MLflow pracovního prostoru (místo experimentu MLflow poznámkového bloku) a před spuštěním libovolného sledovacího kódu MLflow v poznámkovém bloku pracovního prostoru zavolejte mlflow.set_experiment("/path/to/experiment") do poznámkového bloku pracovního prostoru. Další podrobnosti najdete v tématu Prevence ztráty dat v experimentech MLflow.

Pole Cesta se zobrazí po nakonfigurování odkazu na Git.

Zadejte relativní cestu k poznámkovému bloku, například etl/bronze/ingest.py.

Důležité

Když zadáte relativní cestu, nezačínejte ani /nezačínejte ./ . Pokud je například absolutní cesta k poznámkovému bloku, ke které chcete získat přístup /etl/bronze/ingest.py, zadejte etl/bronze/ingest.py do pole Cesta .

Konfigurace výpočetních a závislých knihoven

  1. Pomocí Compute vyberte nebo nakonfigurujte cluster, který podporuje logiku ve vašem sešitu.
  2. Pokud používáte Serverless výpočetní prostředky, pomocí pole Prostředí a knihovny vyberte, upravte nebo přidejte nové prostředí. Viz Instalace závislostí poznámkového bloku.
  3. U všech ostatních konfigurací výpočetních prostředků klikněte na + Přidat v části Závislé knihovny. Zobrazí se dialogové okno Přidat závislá knihovna .
    • Můžete vybrat existující knihovnu nebo nahrát novou knihovnu.
    • Knihovny uložené v umístění podporovaném konfiguracemi výpočetních prostředků můžete používat jenom v umístění. Viz podpora knihovny Pythonu.
    • Každý zdroj knihovny má jiný tok pro výběr nebo nahrání knihovny. Viz knihovny.

Dokončení konfigurace úlohy

  1. (Volitelné) Nakonfigurujte parametry jako páry klíč-hodnota, ke kterým lze přistupovat v poznámkovém bloku pomocí dbutils.widgets. Viz Konfigurace parametrů úlohy.
  2. Klikněte na Uložit úkol.

Omezení

Celkový výstup buňky poznámkového bloku (kombinovaný výstup všech buněk poznámkového bloku) podléhá limitu velikosti 20 MB. Výstup jednotlivých buněk navíc podléhá limitu velikosti 8 MB. Pokud celkový výstup buňky přesahuje velikost 20 MB nebo pokud je výstup jednotlivé buňky větší než 8 MB, spuštění se zruší a označí jako neúspěšné.

Pokud potřebujete pomoc s hledáním buněk poblíž nebo nad limitem, spusťte poznámkový blok na univerzálním clusteru a použijte tuto techniku automatického ukládání .