Úloha skriptu Pythonu pro úlohy
Ke spuštění souboru Pythonu použijte úlohu skriptu Pythonu.
Konfigurace úlohy skriptu Pythonu
Než začnete, musíte skript Pythonu nahrát do umístění přístupného uživateli, který úlohu konfiguruje. Databricks doporučuje používat soubory pracovních prostorů pro skripty Pythonu. Podívejte se, co jsou soubory pracovního prostoru?
Poznámka:
Uživatelské rozhraní úloh zobrazuje možnosti dynamicky na základě jiných nakonfigurovaných nastavení.
Databricks doporučuje ukládat kód nebo data pomocí kořenového adresáře DBFS nebo připojení. Místo toho můžete migrovat skripty Pythonu do souborů nebo svazků pracovního prostoru nebo používat identifikátory URI pro přístup ke cloudovému úložišti objektů.
Zahájení toku pro konfiguraci Python script
úlohy:
- V uživatelském rozhraní Úloh přejděte na kartu Úkoly .
- V rozevírací nabídce Typ vyberte
Python script
.
Konfigurace zdroje
V rozevírací nabídce Zdroj vyberte umístění skriptu Pythonu pomocí jedné z následujících možností.
Pracovní prostor
Pomocí pracovního prostoru můžete nakonfigurovat skript Pythonu uložený pomocí souborů pracovního prostoru.
- Klikněte na pole Cesta . Zobrazí se dialogové okno Vybrat soubor Pythonu.
- Přejděte ke skriptu Pythonu, kliknutím zvýrazněte soubor a klikněte na Potvrdit.
Poznámka:
Tuto možnost můžete použít ke konfiguraci úlohy ve skriptu Pythonu uloženém ve složce Databricks Git. Databricks doporučuje používat možnost poskytovatele Gitu a vzdálené úložiště Git k prostředkům verzí naplánovaným s úlohami.
DBFS/ADLS
Pomocí DBFS/ADLS můžete nakonfigurovat skript Pythonu uložený ve svazku, umístění cloudového úložiště objektů nebo kořen DBFS.
Databricks doporučuje ukládat skripty Pythonu ve svazcích katalogu Unity nebo v cloudovém úložišti objektů.
Do pole Cesta zadejte identifikátor URI do skriptu Pythonu. Například /Volumes/path/to/script.py
nebo abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py
.
Poskytovatel Gitu
Pomocí zprostředkovatele Git můžete nakonfigurovat skript Pythonu uložený ve vzdáleném úložišti Git.
Možnosti zobrazené uživatelským rozhraním závisí na tom, jestli jste už nakonfigurovali jiného poskytovatele Gitu. Pro všechny úlohy v úloze lze použít pouze jedno vzdálené úložiště Git. Viz Použití Gitu s úlohami.
Pole Cesta se zobrazí po nakonfigurování odkazu na Git.
Zadejte relativní cestu pro skript Pythonu, například etl/bronze/ingest.py
.
Důležité
Když zadáte relativní cestu, nezačínejte ani ./
nezačínejte /
. Pokud je například absolutní cesta kódu Pythonu, ke které chcete získat přístup /etl/bronze/ingest.py
, zadejte etl/bronze/ingest.py
do pole Cesta .
Konfigurace výpočetních a závislých knihoven
- Pomocí služby Compute můžete vybrat nebo nakonfigurovat cluster, který podporuje logiku ve vašem skriptu.
- Pokud používáte
Serverless
výpočetní prostředky, vyberte, upravte nebo přidejte nové prostředí pomocí pole Prostředí a knihovny . Viz Instalace závislostí poznámkového bloku. - U všech ostatních konfigurací výpočetních prostředků klikněte na + Přidat v části Závislé knihovny. Zobrazí se dialogové okno Přidat závislá knihovna .
Dokončení konfigurace úlohy
- (Volitelné) Nakonfigurujte parametry jako seznam řetězců předaných jako argumenty rozhraní příkazového řádku skriptu Pythonu. Viz Konfigurace parametrů úkolu.
- Klikněte na Uložit úkol.