Úkol poznámkového bloku pro úlohy
Pomocí úlohy poznámkového bloku nasaďte poznámkové bloky Databricks.
Konfigurace úlohy poznámkového bloku
Než začnete, musíte mít poznámkový blok v umístění přístupném uživatelem, který úlohu konfiguruje.
Poznámka:
Uživatelské rozhraní úloh zobrazuje možnosti dynamicky na základě jiných nakonfigurovaných nastavení.
Zahájení toku pro konfiguraci Notebook
úlohy:
- V uživatelském rozhraní Úloh přejděte na kartu Úkoly .
- V rozevírací nabídce Typ vyberte
Notebook
.
Konfigurace zdroje
V rozevírací nabídce Zdroj vyberte umístění skriptu Pythonu pomocí jedné z následujících možností.
Pracovní prostor
Pomocí pracovního prostoru můžete nakonfigurovat poznámkový blok uložený v pracovním prostoru provedením následujících kroků:
- Klikněte na pole Cesta . Zobrazí se dialogové okno Výběr poznámkového bloku.
- Přejděte do poznámkového bloku, kliknutím zvýrazněte soubor a klikněte na Potvrdit.
Poznámka:
Tuto možnost můžete použít ke konfiguraci úlohy pro poznámkový blok uložený ve složce Git Databricks. Databricks doporučuje použít možnost poskytovatele Gitu a vzdálené úložiště Git pro správu verzí prostředků naplánovaných s úlohami.
Poskytovatel Gitu
Pomocí poskytovatele Gitu nakonfigurujte poznámkový blok ve vzdáleném úložišti Git.
Možnosti zobrazené uživatelským rozhraním závisí na tom, jestli jste už nakonfigurovali jiného poskytovatele Gitu. Pro všechny úlohy v úloze lze použít pouze jedno vzdálené úložiště Git. Viz Použití Gitu s úlohami.
Důležité
Poznámkové bloky vytvořené úlohami Azure Databricks, které běží ze vzdálených úložišť Git, jsou dočasné a nelze se spoléhat na sledování spuštění, experimentů nebo modelů MLflow. Při vytváření poznámkového bloku z úlohy použijte experiment MLflow pracovního prostoru (místo experimentu MLflow poznámkového bloku) a před spuštěním libovolného sledovacího kódu MLflow v poznámkovém bloku pracovního prostoru zavolejte mlflow.set_experiment("/path/to/experiment")
do poznámkového bloku pracovního prostoru. Další podrobnosti najdete v tématu Prevence ztráty dat v experimentech MLflow.
Pole Cesta se zobrazí po nakonfigurování odkazu na Git.
Zadejte relativní cestu k poznámkovému bloku, například etl/bronze/ingest.py
.
Důležité
Když zadáte relativní cestu, nezačínejte ani /
nezačínejte ./
. Pokud je například absolutní cesta k poznámkovému bloku, ke které chcete získat přístup /etl/bronze/ingest.py
, zadejte etl/bronze/ingest.py
do pole Cesta .
Konfigurace výpočetních a závislých knihoven
- Pomocí Compute vyberte nebo nakonfigurujte cluster, který podporuje logiku ve vašem sešitu.
- Pokud používáte
Serverless
výpočetní prostředky, pomocí pole Prostředí a knihovny vyberte, upravte nebo přidejte nové prostředí. Viz Instalace závislostí poznámkového bloku. - U všech ostatních konfigurací výpočetních prostředků klikněte na + Přidat v části Závislé knihovny. Zobrazí se dialogové okno Přidat závislá knihovna .
Dokončení konfigurace úlohy
- (Volitelné) Nakonfigurujte parametry jako páry klíč-hodnota, ke kterým lze přistupovat v poznámkovém bloku pomocí
dbutils.widgets
. Viz Konfigurace parametrů úlohy. - Klikněte na Uložit úkol.
Omezení
Celkový výstup buňky poznámkového bloku (kombinovaný výstup všech buněk poznámkového bloku) podléhá limitu velikosti 20 MB. Výstup jednotlivých buněk navíc podléhá limitu velikosti 8 MB. Pokud celkový výstup buňky přesahuje velikost 20 MB nebo pokud je výstup jednotlivé buňky větší než 8 MB, spuštění se zruší a označí jako neúspěšné.
Pokud potřebujete pomoc s hledáním buněk poblíž nebo nad limitem, spusťte poznámkový blok na univerzálním clusteru a použijte tuto techniku automatického ukládání .