Python-skriptuppgift för jobb
Använd Python-skriptaktiviteten för att köra en Python-fil.
Konfigurera en Python-skriptuppgift
Innan du börjar måste du ladda upp Python-skriptet till en plats som är tillgänglig för användaren som konfigurerar jobbet. Databricks rekommenderar att du använder arbetsytefiler för Python-skript. Se Vad är arbetsytefiler?.
Kommentar
Användargränssnittet för jobb visar alternativ dynamiskt baserat på andra konfigurerade inställningar.
Databricks rekommenderar att du inte lagrar kod eller data med hjälp av DBFS-roten eller monteringarna. I stället kan du migrera Python-skript till arbetsytefiler eller volymer eller använda URI:er för att komma åt molnobjektlagring.
Så här startar du flödet för att konfigurera en Python script
uppgift:
- Gå till fliken Uppgifter i användargränssnittet för jobb.
- I listrutan Typ väljer du
Python script
.
Konfigurera källan
I listrutan Källa väljer du en plats för Python-skriptet med något av följande alternativ.
Arbetsyta
Använd Arbetsyta för att konfigurera ett Python-skript som lagras med hjälp av arbetsytefiler.
- Klicka på fältet Sökväg . Dialogrutan Välj Python-fil visas.
- Bläddra till Python-skriptet, klicka för att markera filen och klicka på Bekräfta.
Kommentar
Du kan använda det här alternativet för att konfigurera en uppgift i ett Python-skript som lagras i en Databricks Git-mapp. Databricks rekommenderar att du använder alternativet Git-provider och en fjärransluten Git-lagringsplats till versionstillgångar som schemalagts med jobb.
DBFS/ADLS
Använd DBFS/ADLS för att konfigurera ett Python-skript som lagras på en volym, lagringsplats för molnobjekt eller DBFS-roten.
Databricks rekommenderar att du lagrar Python-skript i Unity Catalog-volymer eller molnobjektlagring.
I fältet Sökväg anger du URI:n till Python-skriptet. Exempel: /Volumes/path/to/script.py
eller abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py
.
Git-provider
Använd Git-providern för att konfigurera ett Python-skript som lagras på en fjärransluten Git-lagringsplats.
Vilka alternativ som visas i användargränssnittet beror på om du redan har konfigurerat en Git-provider någon annanstans. Endast en fjärransluten Git-lagringsplats kan användas för alla uppgifter i ett jobb. Se Använda Git med jobb.
Fältet Sökväg visas när du har konfigurerat en git-referens.
Ange den relativa sökvägen för Python-skriptet, till exempel etl/bronze/ingest.py
.
Viktigt!
När du anger den relativa sökvägen ska du inte börja med /
eller ./
. Om den absoluta sökvägen för Python-koden som du vill komma åt till exempel är /etl/bronze/ingest.py
anger du etl/bronze/ingest.py
i fältet Sökväg .
Konfigurera beräkningsbibliotek och beroende bibliotek
- Använd Compute för att välja eller konfigurera ett kluster som stöder logiken i skriptet.
- Om du använder
Serverless
beräkning använder du fältet Miljö och bibliotek för att välja, redigera eller lägga till en ny miljö. Se Installera notebook-beroenden. - För alla andra beräkningskonfigurationer klickar du på + Lägg till under Beroende bibliotek. Dialogrutan Lägg till beroende bibliotek visas.
- Du kan välja ett befintligt bibliotek eller ladda upp ett nytt bibliotek.
- Du kan bara använda bibliotek som lagras på en plats som stöds av dina beräkningskonfigurationer. Se Stöd för Python-bibliotek.
- Varje bibliotekskälla har ett annat flöde för att välja eller ladda upp ett bibliotek. Se Bibliotek.
Slutför jobbkonfigurationen
- (Valfritt) Konfigurera Parametrar som en lista över strängar som skickas som CLI-argument till Python-skriptet. Se Konfigurera aktivitetsparametrar.
- Klicka på Spara uppgift.