Het Python-proces opnieuw starten in Azure Databricks
U kunt het Python-proces op Azure Databricks programmatisch opnieuw starten om ervoor te zorgen dat lokaal geïnstalleerde of bijgewerkte bibliotheken correct werken in de Python-kernel voor uw huidige SparkSession.
Wanneer u het Python-proces opnieuw start, raakt u statusgegevens van Python kwijt. Databricks raadt aan om alle bibliotheken met sessiebereik aan het begin van een notebook te installeren en uit te voeren dbutils.library.restartPython()
om het Python-proces op te schonen voordat u doorgaat.
U kunt dit proces gebruiken in interactieve notebooks of voor Python-taken die zijn gepland met taken.
Wat is dbutils.library.restartPython
?
De helperfunctie dbutils.library.restartPython()
is de aanbevolen manier om het Python-proces opnieuw te starten in een Databricks-notebook.
Notitie
De meeste functies in de dbutils.library
submodule zijn afgeschaft. Databricks raadt %pip
u ten zeerste aan om alle bibliotheekinstallaties met notebookbereik te beheren. Zie Notebook-scoped Python libraries (Notebook-scoped Python-bibliotheken) voor meer informatie.
Wanneer moet u het Python-proces opnieuw starten?
Het is een goed idee om uw Python-proces opnieuw te starten wanneer u een lokale installatie uitvoert die een van de volgende onderdelen bevat:
- Een versie van een pakket opgeven dat is opgenomen in Databricks Runtime.
- Het installeren van een aangepaste versie van een pakket dat is opgenomen in Databricks Runtime.
- Een bibliotheek expliciet bijwerken naar de nieuwste versie met behulp van
%pip install <library-name> --upgrade
. - Een aangepaste omgeving configureren vanuit een lokaal
requirements.txt
bestand. - Het installeren van een bibliotheek waarvoor de versies van afhankelijke bibliotheken moeten worden gewijzigd die zijn opgenomen in Databricks Runtime.