Databricks Runtime 13.1 voor Machine Learning (EoS)


Ondersteuning voor deze Databricks Runtime-versie is beëindigd. Zie de geschiedenis van einde van ondersteuning voor de einddatum van de ondersteuning. Zie de releaseversies en compatibiliteit van Databricks Runtime voor alle ondersteunde Databricks Runtime-versies.

Databricks Runtime 13.1 voor Machine Learning biedt een kant-en-klare omgeving voor machine learning en gegevenswetenschap op basis van Databricks Runtime 13.1 (EoS). Databricks Runtime ML bevat veel populaire machine learning-bibliotheken, waaronder TensorFlow, PyTorch en XGBoost. Databricks Runtime ML bevat AutoML, een hulpprogramma voor het automatisch trainen van machine learning-pijplijnen. Databricks Runtime ML biedt ook ondersteuning voor gedistribueerde Deep Learning-training met behulp van Horovod.

Zie AI en machine learning op Databricks voor meer informatie, inclusief instructies voor het maken van een Databricks Runtime ML-cluster.

Nieuwe functies en verbeteringen

Databricks Runtime 13.1 ML is gebouwd op Databricks Runtime 13.1. Zie de releaseopmerkingen van Databricks Runtime 13.1, waaronder Apache Spark MLlib en SparkR, voor informatie over wat er nieuw is in Databricks Runtime 13.1 (EoS ).

Wijzigingen in Databricks Feature Store

In Databricks Runtime 13.1 ML en hoger gebruikt u in MySQL-archieven publish_table LONGTEXT-type voor tekenreeksgegevens in functietabellen. Als u een tabel publiceert met Databricks Runtime 13.1 ML en vervolgens naar de tabel moet schrijven met Databricks Runtime 13.0 of lager, moet u de overschrijfmodus gebruiken publish_table of de onlinetabel verwijderen en opnieuw publiceren.


De systeemomgeving in Databricks Runtime 13.1 ML verschilt als volgt van Databricks Runtime 13.1:

Databricks Runtime 13.1 ML bevat XGBoost 1.7.5, die geen ONDERSTEUNING biedt voor GPU-clusters met rekencapaciteit 5.2 en lager.


In de volgende secties worden de bibliotheken vermeld die zijn opgenomen in Databricks Runtime 13.1 ML die verschillen van de bibliotheken die zijn opgenomen in Databricks Runtime 13.1.

In deze sectie:

Bibliotheken met de hoogste laag

Databricks Runtime 13.1 ML bevat de volgende bibliotheken met de hoogste laag:


Databricks Runtime 13.1 ML maakt gebruik van Virtualenv voor Python-pakketbeheer en bevat veel populaire ML-pakketten.

De volgende Python-bibliotheken zijn geïntroduceerd met Databricks Runtime 13.1 ML:

  • langchain
  • librosa
  • pytesseract
  • zinsstuk
  • zinstransformatoren
  • soundfile
  • tiktoken

Naast de pakketten die in de volgende secties zijn opgegeven, bevat Databricks Runtime 13.1 ML ook de volgende pakketten:

  • hyperopt 0.2.7+db3
  • sparkdl-3.0.0_db1
  • automl 1.18.0

Als u de Databricks Runtime ML Python-omgeving in uw lokale virtuele Python-omgeving wilt reproduceren, downloadt u het requirements-13.1.txt-bestand en voert u het uitpip install -r requirements-13.1.txt. Met deze opdracht worden alle opensourcebibliotheken geïnstalleerd die door Databricks Runtime ML worden gebruikt, maar worden er geen bibliotheken geïnstalleerd die zijn ontwikkeld door Databricks, zoals databricks-automl, databricks-feature-storeof de Databricks-fork van hyperopt.

Python-bibliotheken op CPU-clusters

Python-bibliotheken op GPU-clusters

De R-bibliotheken zijn identiek aan de R-bibliotheken in Databricks Runtime 13.1.

Java- en Scala-bibliotheken (Scala 2.12-cluster)

Naast Java- en Scala-bibliotheken in Databricks Runtime 13.1 bevat Databricks Runtime 13.1 ML de volgende JAR's:


