Udostępnij za pośrednictwem


Uruchom ponownie proces języka Python w usłudze Azure Databricks

Możesz programowo ponownie uruchomić proces języka Python w usłudze Azure Databricks, aby upewnić się, że lokalnie zainstalowane lub uaktualnione biblioteki działają poprawnie w jądrze języka Python dla bieżącej usługi SparkSession.

Po ponownym uruchomieniu procesu języka Python utracisz informacje o stanie języka Python. Usługa Databricks zaleca zainstalowanie wszystkich bibliotek o zakresie sesji na początku notesu i uruchomienie dbutils.library.restartPython() go w celu wyczyszczenia procesu języka Python przed kontynuowaniem.

Ten proces można używać w notesach interaktywnych lub zadaniach języka Python zaplanowanych z zadaniami.

Co to jest usługa dbutils.library.restartPython?

Funkcja dbutils.library.restartPython() pomocnika jest zalecanym sposobem ponownego uruchomienia procesu języka Python w notesie usługi Databricks.

Uwaga

Większość funkcji w module podrzędnym dbutils.library jest przestarzała. Usługa Databricks zdecydowanie zaleca używanie funkcji %pip do zarządzania wszystkimi instalacjami bibliotek o zakresie notesu. Zobacz Biblioteki języka Python o zakresie notesu.

Kiedy należy ponownie uruchomić proces języka Python?

Dobrym pomysłem jest ponowne uruchomienie procesu języka Python w dowolnym momencie, gdy wykonasz instalację lokalną, która obejmuje dowolną z następujących czynności:

  • Określanie wersji pakietu uwzględnionego w środowisku Databricks Runtime.
  • Instalowanie niestandardowej wersji pakietu uwzględnionego w środowisku Databricks Runtime.
  • Jawne aktualizowanie biblioteki do najnowszej wersji przy użyciu polecenia %pip install <library-name> --upgrade.
  • Konfigurowanie środowiska niestandardowego z pliku lokalnego requirements.txt .
  • Instalowanie biblioteki, która wymaga zmiany wersji bibliotek zależnych, które są zawarte w środowisku Databricks Runtime.