Databricks Runtime 15.3 per Machine Learning (EoS)
Il supporto per questa versione di Databricks Runtime è terminato. Per la data di fine del supporto, vedere cronologia di fine del supporto. Per tutte le versioni supportate di Databricks Runtime, vedere versioni e compatibilità delle note di rilascio di Databricks Runtime.
Databricks Runtime 15.3 per Machine Learning offre un ambiente dito-go pronto per l'apprendimento automatico e l'analisi scientifica dei dati basato su Databricks Runtime 15.3 (EoS). Databricks Runtime ML contiene molte librerie di Machine Learning più diffuse, tra cui TensorFlow, PyTorch e XGBoost. Databricks Runtime ML include AutoML, uno strumento per eseguire automaticamente il training delle pipeline di Machine Learning. Databricks Runtime ML supporta anche il training di Deep Learning distribuito usando Horovod.
Per visualizzare le note sulla versione per le versioni di Databricks Runtime che hanno raggiunto la fine del supporto (EoS), vedere Note sulla versione fine del supporto di Databricks Runtime. Le versioni di EoS Databricks Runtime sono state ritirate e potrebbero non essere aggiornate.
Nuove funzionalità e miglioramenti
Databricks Runtime 15.3 ML è basato su Databricks Runtime 15.3. Per informazioni sulle novità di Databricks Runtime 15.3, tra cui Apache Spark MLlib e SparkR, vedere le note sulla versione Databricks Runtime 15.3 (EoS).
Suddivisioni manuali dei dati di AutoML e pesi dei campioni
AutoML supporta ora suddivisioni manuali dei dati, consentendo di specificare riga per riga i dataset di training, validazione e test per i modelli di classificazione e regressione. Vedere Suddividere i dati in set di training, convalida e test.
AutoML supporta ora i pesi di esempio, consentendo di modificare l'importanza di ogni riga durante il training del modello di regressione. Per altre informazioni, vedere i parametri di regressione per l'API Python AutoML.
Ambiente di sistema
L'ambiente di sistema in Databricks Runtime 15.3 ML differisce da Databricks Runtime 15.3 come indicato di seguito:
- Per i cluster GPU, Databricks Runtime ML include le librerie GPU NVIDIA seguenti:
- CUDA 12.1
- cusolver
- cupti 12.1
- cuDNN
- NCCL 2.17.1
- TensorRT
Le sezioni seguenti elencano le librerie incluse in Databricks Runtime 15.3 ML che differiscono da quelle incluse in Databricks Runtime 15.3.
In questa sezione:
Librerie di livello superiore
Databricks Runtime 15.3 ML includono le seguenti librerie di livello superiore .
- set di dati
- GraphFrames
- MLflow
- PyTorch
- spark-tensorflow-connector
- Scikit-learn
- TensorFlow
- TensorBoard
- trasformatori
Librerie Python
Databricks Runtime 15.3 ML usa virtualenv
per la gestione dei pacchetti Python e include molti pacchetti di Machine Learning più diffusi.
Oltre ai pacchetti specificati nelle sezioni seguenti, Databricks Runtime 15.3 ML include anche i pacchetti seguenti:
- hyperopt 0.2.7+db3
- sparkdl 3.0.0_db1
- automl 1.27.0
Per riprodurre l'ambiente Python di Databricks Runtime ML nell'ambiente virtuale Python locale, scaricare il file di requirements-15.3.txt ed eseguire pip install -r requirements-15.3.txt
. Questo comando installa tutte le librerie open source usate da Databricks Runtime ML, ma non installa librerie sviluppate da Databricks, ad esempio databricks-automl
, databricks-feature-engineering
o il fork di Databricks di hyperopt
Librerie Python nei cluster di CPU
Librerie Python sui cluster GPU
Librerie R
Le librerie R sono identiche alle librerie R in Databricks Runtime 15.3.
Librerie Java e Scala (cluster Scala 2.12)
Oltre alle librerie Java e Scala in Databricks Runtime 15.3, Databricks Runtime 15.3 ML contiene i file JAR seguenti:
Cluster di CPU
