Werkruimtepakketten
Werkruimtepakketten kunnen aangepaste of privéwielbestanden (Python), JAR-bestanden (Scala/Java) of tar.gz (R) zijn. U kunt deze pakketten uploaden naar uw werkruimte en ze later toewijzen aan een specifieke Spark-pool.
Werkruimtepakketten toevoegen:
- Navigeer naar het tabblad Werkruimtepakketten beheren>.
- Upload uw wielbestanden met behulp van de bestandskiezer.
- Zodra de bestanden zijn geüpload naar de Azure Synapse werkruimte, kunt u deze pakketten toevoegen aan een bepaalde Apache Spark-pool.
Waarschuwing
Binnen Azure Synapse kan een Apache Spark-pool gebruikmaken van aangepaste bibliotheken die zijn geüpload als werkruimtepakketten of geüpload binnen een bekend Azure Data Lake Storage pad. Beide opties kunnen echter niet tegelijkertijd worden gebruikt binnen dezelfde Apache Spark-pool. Als pakketten worden geleverd met behulp van beide methoden, worden alleen de wielbestanden geïnstalleerd die zijn opgegeven in de lijst Werkruimtepakketten.
Zodra werkruimtepakketten zijn gebruikt voor het installeren van pakketten in een bepaalde Apache Spark-pool, is er een beperking dat u geen pakketten meer kunt opgeven met behulp van het opslagaccountpad in dezelfde pool.
Notitie
Het is raadzaam dat u niet meerdere wielpakketten met dezelfde naam in een werkruimte hebt. Als u een andere versie van hetzelfde wielpakket wilt gebruiken, moet u de bestaande versie verwijderen en de nieuwe uploaden.
Storage-account
Aangepaste wielpakketten kunnen worden geïnstalleerd in de Apache Spark-pool door alle wheel-bestanden te uploaden naar het Azure Data Lake Storage-account (Gen2) dat is gekoppeld aan de Synapse-werkruimte.
De bestanden moeten worden geüpload naar het volgende pad in de standaardcontainer van het opslagaccount:
abfss://<file_system>@<account_name>.dfs.core.windows.net/synapse/workspaces/<workspace_name>/sparkpools/<pool_name>/libraries/python/
Waarschuwing
- In sommige gevallen moet u mogelijk het bestandspad maken op basis van de bovenstaande structuur als dit nog niet bestaat. Mogelijk moet u bijvoorbeeld de
python
map in de map toevoegen als dezelibraries
nog niet bestaat. - Deze methode voor het beheren van aangepaste wielbestanden wordt niet ondersteund op de Azure Synapse Runtime voor Apache Spark 3.0. Raadpleeg de functie Werkruimtepakketten voor het beheren van aangepaste wielbestanden.
Belangrijk
Als u aangepaste bibliotheken wilt installeren met behulp van de Azure DataLake Storage-methode, moet u de machtiging Inzender voor opslagblobgegevens of Eigenaar van opslagblobgegevens hebben voor het primaire Gen2 Storage-account dat is gekoppeld aan de Azure Synapse Analytics-werkruimte.
Volgende stappen
- De standaardbibliotheken weergeven: Versieondersteuning voor Apache Spark
- Bibliotheekinstallatiefouten oplossen: Bibliotheekfouten oplossen
- Een privé-Conda-kanaal maken met uw Azure Data Lake Storage-account: Conda-privékanalen