Delen via


Het Python-proces opnieuw starten in Azure Databricks

U kunt het Python-proces op Azure Databricks programmatisch opnieuw starten om ervoor te zorgen dat lokaal geïnstalleerde of bijgewerkte bibliotheken correct werken in de Python-kernel voor uw huidige SparkSession.

Wanneer u het Python-proces opnieuw start, raakt u statusgegevens van Python kwijt. Databricks raadt aan om alle bibliotheken met sessiebereik aan het begin van een notebook te installeren en uit te voeren dbutils.library.restartPython() om het Python-proces op te schonen voordat u doorgaat.

U kunt dit proces gebruiken in interactieve notebooks of voor Python-taken die zijn gepland met taken.

Wat is dbutils.library.restartPython?

De helperfunctie dbutils.library.restartPython() is de aanbevolen manier om het Python-proces opnieuw te starten in een Databricks-notebook.

Notitie

De meeste functies in de dbutils.library submodule zijn afgeschaft. Databricks raadt %pip u ten zeerste aan om alle bibliotheekinstallaties met notebookbereik te beheren. Zie Notebook-scoped Python libraries (Notebook-scoped Python-bibliotheken) voor meer informatie.

Wanneer moet u het Python-proces opnieuw starten?

Het is een goed idee om uw Python-proces opnieuw te starten wanneer u een lokale installatie uitvoert die een van de volgende onderdelen bevat:

  • Een versie van een pakket opgeven dat is opgenomen in Databricks Runtime.
  • Het installeren van een aangepaste versie van een pakket dat is opgenomen in Databricks Runtime.
  • Een bibliotheek expliciet bijwerken naar de nieuwste versie met behulp van %pip install <library-name> --upgrade.
  • Een aangepaste omgeving configureren vanuit een lokaal requirements.txt bestand.
  • Het installeren van een bibliotheek waarvoor de versies van afhankelijke bibliotheken moeten worden gewijzigd die zijn opgenomen in Databricks Runtime.