Installera bibliotek från en paketlagringsplats
Azure Databricks innehåller verktyg för att installera bibliotek från PyPI-, Maven- och CRAN-paketlagringsplatser. Se Bibliotek med klusteromfattning för fullständig bibliotekskompatibilitetsinformation .
Viktigt!
Bibliotek kan installeras från DBFS när du använder Databricks Runtime 14.3 LTS och nedan. Alla arbetsyteanvändare kan dock ändra biblioteksfiler som lagras i DBFS. För att förbättra säkerheten för bibliotek på en Azure Databricks-arbetsyta är lagring av biblioteksfiler i DBFS-roten inaktuell och inaktiverad som standard i Databricks Runtime 15.1 och senare. Se Lagra bibliotek i DBFS-roten är inaktuell och inaktiverad som standard.
I stället rekommenderar Databricks att ladda upp alla bibliotek, inklusive Python-bibliotek, JAR-filer och Spark-anslutningskopplingar, till arbetsytans filer eller Unity Catalogvolumes, eller att använda biblioteksförvar. Om din arbetsbelastning inte stöder dessa mönster kan du även använda bibliotek som lagras i molnobjektlagring.
PyPI-paket
I bibliotekskälla knappenlistselectPyPI.
Ange ett PyPI-paketnamn. Om du vill installera en specifik version av ett bibliotek använder du det här formatet för biblioteket:
<library>==<version>
. Exempel:scikit-learn==0.19.1
Kommentar
För jobb rekommenderar Databricks att du anger en biblioteksversion för att säkerställa en reproducerbar miljö. Om biblioteksversionen inte är helt angiven använder Databricks den senaste matchande versionen. Det innebär att olika körningar av samma jobb kan använda olika biblioteksversioner när nya versioner publiceras. Om du anger biblioteksversionen förhindras nya, icke-bakåtkompatibla ändringar i bibliotek från att bryta dina jobb.
(Valfritt) I fältet Index-URL anger du en Url för PyPI-index.
Klicka på Installera.
Maven- eller Spark-paket
Viktigt!
Om du vill installera Maven-bibliotek på beräkning som konfigurerats med läget för delad åtkomst måste du lägga till koordinaterna i listan över tillåtna. Se Tillåtlista bibliotek och init-skript för delad beräkning.
Viktigt!
För DBR 14.3 LTS och nedan använder Databricks Apache Ivy 2.4.0 för att lösa Maven-paket. För DBR 15.0 och senare använder Databricks Ivy 2.5.1 eller senare och den specifika Ivy-versionen visas i Databricks Runtime versionsanteckningar och kompatibilitet.
Installationsordningen för Maven-paket kan påverka det slutliga beroendeträdet, vilket kan påverka i vilken ordning bibliotek läses in.
I knappen bibliotekskällalistselectMaven.
Ange en Maven-koordinat. Gör något av följande:
- I fältet Koordinat anger du Maven-koordinaten för biblioteket som ska installeras. Maven-koordinaterna finns i formuläret
groupId:artifactId:version
, till exempelcom.databricks:spark-avro_2.10:1.0.0
. - Om du inte känner till den exakta koordinaten anger du biblioteksnamnet och klickar på Sökpaket. Det visas list matchande paket. Om du vill visa information om ett paket klickar du på dess namn. Du kan sortera paket efter namn, organisation och klassificering. Du kan också filtrera resultaten genom att skriva en fråga i sökfältet. Resultaten refresh blir automatiskt.
- Select Maven Central eller Spark Packages i listrutan list längst upp till vänster.
- Valfritt select paketversionen i utgåvorna column.
- Klicka på + Select bredvid ett paket. Fältet Koordinat fylls i med det valda paketet och versionen.
- I fältet Koordinat anger du Maven-koordinaten för biblioteket som ska installeras. Maven-koordinaterna finns i formuläret
(Valfritt) I fältet Lagringsplats kan du ange en URL för Maven-lagringsplatsen.
Kommentar
Interna Maven-lagringsplatser stöds inte.
I fältet Undantag kan du ange
groupId
och för deartifactId
beroenden som du vill exkludera (till exempellog4j:log4j
).Kommentar
Maven fungerar med hjälp av den närmast rotversion, och om två paket tävlar om versioner med olika beroenden är ordningen viktig, så den kan misslyckas när paketet med ett äldre beroende läses in först.
Du kan kringgå detta genom att undanta det bibliotek som står i konflikt. När du till exempel installerar paketet med koordinaten
com.microsoft.azure:azure-eventhubs-spark_2.12:2.3.22
, set, justera fältet Undantag tillcom.nimbusds:oauth2-oidc-sdk:RELEASE
, så att den senaste versionen aveventhubs
från MSAL4J laddas in ocheventhubs
-beroendet tillgodoses.Klicka på Installera.
CRAN-paket
- Bibliotekskälla-knappen ,, list, select,CRAN.
- I fältet Paket anger du namnet på paketet.
- (Valfritt) I fältet Lagringsplats kan du ange CRAN-lagringsplatsens URL.
- Klicka på Installera.