Dela via


Python-skriptuppgift för jobb

Använd Python-skriptaktiviteten för att köra en Python-fil.

Konfigurera en Python-skriptuppgift

Innan du börjar måste du ladda upp Python-skriptet till en plats som är tillgänglig för användaren som konfigurerar jobbet. Databricks rekommenderar att du använder arbetsytefiler för Python-skript. Se Vad är arbetsytefiler?.

Kommentar

Användargränssnittet för jobb visar alternativ dynamiskt baserat på andra konfigurerade inställningar.

Databricks rekommenderar att du inte lagrar kod eller data med hjälp av DBFS-roten eller monteringarna. I stället kan du migrera Python-skript till arbetsytefiler eller volymer eller använda URI:er för att komma åt molnobjektlagring.

Så här startar du flödet för att konfigurera en Python script uppgift:

  1. Gå till fliken Uppgifter i användargränssnittet för jobb.
  2. I listrutan Typ väljer du Python script.

Konfigurera källan

I listrutan Källa väljer du en plats för Python-skriptet med något av följande alternativ.

Arbetsyta

Använd Arbetsyta för att konfigurera ett Python-skript som lagras med hjälp av arbetsytefiler.

  1. Klicka på fältet Sökväg . Dialogrutan Välj Python-fil visas.
  2. Bläddra till Python-skriptet, klicka för att markera filen och klicka på Bekräfta.

Kommentar

Du kan använda det här alternativet för att konfigurera en uppgift i ett Python-skript som lagras i en Databricks Git-mapp. Databricks rekommenderar att du använder alternativet Git-provider och en fjärransluten Git-lagringsplats till versionstillgångar som schemalagts med jobb.

DBFS/ADLS

Använd DBFS/ADLS för att konfigurera ett Python-skript som lagras på en volym, lagringsplats för molnobjekt eller DBFS-roten.

Databricks rekommenderar att du lagrar Python-skript i Unity Catalog-volymer eller molnobjektlagring.

I fältet Sökväg anger du URI:n till Python-skriptet. Exempel: /Volumes/path/to/script.py eller abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.

Git-provider

Använd Git-providern för att konfigurera ett Python-skript som lagras på en fjärransluten Git-lagringsplats.

Vilka alternativ som visas i användargränssnittet beror på om du redan har konfigurerat en Git-provider någon annanstans. Endast en fjärransluten Git-lagringsplats kan användas för alla uppgifter i ett jobb. Se Använda Git med jobb.

Fältet Sökväg visas när du har konfigurerat en git-referens.

Ange den relativa sökvägen för Python-skriptet, till exempel etl/bronze/ingest.py.

Viktigt!

När du anger den relativa sökvägen ska du inte börja med / eller ./. Om den absoluta sökvägen för Python-koden som du vill komma åt till exempel är /etl/bronze/ingest.pyanger du etl/bronze/ingest.py i fältet Sökväg .

Konfigurera beräkningsbibliotek och beroende bibliotek

  1. Använd Compute för att välja eller konfigurera ett kluster som stöder logiken i skriptet.
  2. Om du använder Serverless beräkning använder du fältet Miljö och bibliotek för att välja, redigera eller lägga till en ny miljö. Se Installera notebook-beroenden.
  3. För alla andra beräkningskonfigurationer klickar du på + Lägg till under Beroende bibliotek. Dialogrutan Lägg till beroende bibliotek visas.
    • Du kan välja ett befintligt bibliotek eller ladda upp ett nytt bibliotek.
    • Du kan bara använda bibliotek som lagras på en plats som stöds av dina beräkningskonfigurationer. Se Stöd för Python-bibliotek.
    • Varje bibliotekskälla har ett annat flöde för att välja eller ladda upp ett bibliotek. Se Bibliotek.

Slutför jobbkonfigurationen

  1. (Valfritt) Konfigurera Parametrar som en lista över strängar som skickas som CLI-argument till Python-skriptet. Se Konfigurera aktivitetsparametrar.
  2. Klicka på Spara uppgift.