Sdílet prostřednictvím


Úloha skriptu Pythonu pro úlohy

Ke spuštění souboru Pythonu použijte úlohu skriptu Pythonu.

Konfigurace úlohy skriptu Pythonu

Než začnete, musíte skript Pythonu nahrát do umístění přístupného uživateli, který úlohu konfiguruje. Databricks doporučuje používat soubory pracovních prostorů pro skripty Pythonu. Podívejte se, co jsou soubory pracovního prostoru?

Poznámka:

Uživatelské rozhraní úloh zobrazuje možnosti dynamicky na základě jiných nakonfigurovaných nastavení.

Databricks doporučuje ukládat kód nebo data pomocí kořenového adresáře DBFS nebo připojení. Místo toho můžete migrovat skripty Pythonu do souborů nebo svazků pracovního prostoru nebo používat identifikátory URI pro přístup ke cloudovému úložišti objektů.

Zahájení toku pro konfiguraci Python script úlohy:

  1. V uživatelském rozhraní Úloh přejděte na kartu Úkoly .
  2. V rozevírací nabídce Typ vyberte Python script.

Konfigurace zdroje

V rozevírací nabídce Zdroj vyberte umístění skriptu Pythonu pomocí jedné z následujících možností.

Pracovní prostor

Pomocí pracovního prostoru můžete nakonfigurovat skript Pythonu uložený pomocí souborů pracovního prostoru.

  1. Klikněte na pole Cesta . Zobrazí se dialogové okno Vybrat soubor Pythonu.
  2. Přejděte ke skriptu Pythonu, kliknutím zvýrazněte soubor a klikněte na Potvrdit.

Poznámka:

Tuto možnost můžete použít ke konfiguraci úlohy ve skriptu Pythonu uloženém ve složce Databricks Git. Databricks doporučuje používat možnost poskytovatele Gitu a vzdálené úložiště Git k prostředkům verzí naplánovaným s úlohami.

DBFS/ADLS

Pomocí DBFS/ADLS můžete nakonfigurovat skript Pythonu uložený ve svazku, umístění cloudového úložiště objektů nebo kořen DBFS.

Databricks doporučuje ukládat skripty Pythonu ve svazcích katalogu Unity nebo v cloudovém úložišti objektů.

Do pole Cesta zadejte identifikátor URI do skriptu Pythonu. Například /Volumes/path/to/script.py nebo abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.

Poskytovatel Gitu

Pomocí zprostředkovatele Git můžete nakonfigurovat skript Pythonu uložený ve vzdáleném úložišti Git.

Možnosti zobrazené uživatelským rozhraním závisí na tom, jestli jste už nakonfigurovali jiného poskytovatele Gitu. Pro všechny úlohy v úloze lze použít pouze jedno vzdálené úložiště Git. Viz Použití Gitu s úlohami.

Pole Cesta se zobrazí po nakonfigurování odkazu na Git.

Zadejte relativní cestu pro skript Pythonu, například etl/bronze/ingest.py.

Důležité

Když zadáte relativní cestu, nezačínejte ani ./nezačínejte / . Pokud je například absolutní cesta kódu Pythonu, ke které chcete získat přístup /etl/bronze/ingest.py, zadejte etl/bronze/ingest.py do pole Cesta .

Konfigurace výpočetních a závislých knihoven

  1. Pomocí služby Compute můžete vybrat nebo nakonfigurovat cluster, který podporuje logiku ve vašem skriptu.
  2. Pokud používáte Serverless výpočetní prostředky, vyberte, upravte nebo přidejte nové prostředí pomocí pole Prostředí a knihovny . Viz Instalace závislostí poznámkového bloku.
  3. U všech ostatních konfigurací výpočetních prostředků klikněte na + Přidat v části Závislé knihovny. Zobrazí se dialogové okno Přidat závislá knihovna .
    • Můžete vybrat existující knihovnu nebo nahrát novou knihovnu.
    • Knihovny uložené v umístění podporovaném konfiguracemi výpočetních prostředků můžete používat jenom v umístění. Viz podpora knihovny Pythonu.
    • Každý zdroj knihovny má jiný tok pro výběr nebo nahrání knihovny. Viz knihovny.

Dokončení konfigurace úlohy

  1. (Volitelné) Nakonfigurujte parametry jako seznam řetězců předaných jako argumenty rozhraní příkazového řádku skriptu Pythonu. Viz Konfigurace parametrů úkolu.
  2. Klikněte na Uložit úkol.