Delen via


Werkruimtepakketten

Werkruimtepakketten kunnen aangepaste of privéwielbestanden (Python), JAR-bestanden (Scala/Java) of tar.gz (R) zijn. U kunt deze pakketten uploaden naar uw werkruimte en deze later toewijzen aan een specifieke Spark-pool.

Werkruimtepakketten toevoegen:

  1. Navigeer naar het tabblad Werkruimtepakketten beheren>.
  2. Upload uw bestanden met behulp van de bestandskiezer.
  3. Zodra de bestanden zijn geüpload naar de Azure Synapse-werkruimte, kunt u deze pakketten toevoegen aan een Apache Spark-pool.

Schermopname met werkruimtepakketten gemarkeerd.

Waarschuwing

  • In Azure Synapse kan een Apache Spark-pool gebruikmaken van aangepaste bibliotheken die worden geüpload als werkruimtepakketten of worden geüpload binnen een bekend Azure Data Lake Storage-pad. Beide opties kunnen echter niet tegelijkertijd in dezelfde Apache Spark-pool worden gebruikt. Als pakketten worden geleverd met beide methoden, worden alleen de wielbestanden die zijn opgegeven in de lijst met werkruimtepakketten geïnstalleerd.

  • Zodra Werkruimtepakketten worden gebruikt om pakketten in een bepaalde Apache Spark-pool te installeren, is er een beperking die u niet langer kunt opgeven met behulp van het pad van het opslagaccount in dezelfde pool.

Notitie

Het is raadzaam dat u niet meerdere pakketten met dezelfde naam in een werkruimte hebt. Als u een andere versie van hetzelfde pakket wilt gebruiken, moet u de bestaande versie verwijderen en de nieuwe uploaden.

Opslagaccount

Aangepaste pakketten kunnen worden geïnstalleerd in de Apache Spark-pool door alle bestanden te uploaden naar het Azure Data Lake Storage-account (Gen2) dat is gekoppeld aan de Synapse-werkruimte.

De bestanden moeten worden geüpload naar het volgende pad in de standaardcontainer van het opslagaccount:

abfss://<file_system>@<account_name>.dfs.core.windows.net/synapse/workspaces/<workspace_name>/sparkpools/<pool_name>/libraries/python/

Waarschuwing

  • In sommige gevallen moet u mogelijk het bestandspad maken op basis van de bovenstaande structuur als dit nog niet bestaat. Mogelijk moet u de map in de libraries map toevoegen python als deze nog niet bestaat.
  • Deze methode voor het beheren van aangepaste bestanden wordt niet ondersteund in de Azure Synapse Runtime voor Apache Spark 3.0. Raadpleeg de functie Werkruimtepakketten voor het beheren van aangepaste bestanden.

Belangrijk

Als u aangepaste bibliotheken wilt installeren met behulp van de Azure DataLake Storage-methode, moet u de machtiging Inzender voor opslagblobgegevens of de eigenaar van opslagblobgegevens hebben voor het primaire Gen2 Storage-account dat is gekoppeld aan de Azure Synapse Analytics-werkruimte.

Volgende stappen