Databricks Runtime 12.0 för Machine Learning (EoS)
Kommentar
Stödet för den här Databricks Runtime-versionen har upphört. Information om slutdatumet för support finns i Historik över supportens slut. Alla Databricks Runtime-versioner som stöds finns i Databricks Runtime-versionsanteckningar och kompatibilitet.
Databricks Runtime 12.0 för Machine Learning ger en färdig miljö för maskininlärning och datavetenskap baserat på Databricks Runtime 12.0 (EoS). Databricks Runtime ML innehåller många populära maskininlärningsbibliotek, inklusive TensorFlow, PyTorch och XGBoost. Databricks Runtime ML innehåller AutoML, ett verktyg för att automatiskt träna maskininlärningspipelines. Databricks Runtime ML stöder även distribuerad djupinlärningsträning med Horovod.
Mer information, inklusive instruktioner för att skapa ett Databricks Runtime ML-kluster, finns i AI och maskininlärning på Databricks.
Nya funktioner och förbättringar
Databricks Runtime 12.0 ML bygger på Databricks Runtime 12.0. Information om nyheter i Databricks Runtime 12.0, inklusive Apache Spark MLlib och SparkR, finns i viktig information om Databricks Runtime 12.0 (EoS).
Förbättringar av AutoML
- Prognosmodeller kan nu inkludera landssemestrar.
- Prognostisering stöder nu månatliga, kvartalsvisa och årliga frekvenser.
- AutoML kan nu använda större datauppsättningar för träning. AutoML allokerar automatiskt fler CPU-kärnor för stora datamängder.
Mer information om AutoML finns i Vad är AutoML?.
MLflow 2.0
Databricks Runtime 12.0 ML innehåller MLflow 2.0. MLflow 2.0 bygger på MLflows starka plattformsgrund och innehåller omfattande användarfeedback för att förenkla arbetsflöden för datavetenskap och leverera innovativa förstklassiga verktyg för MLOps. Funktioner och förbättringar omfattar tillägg till MLflow-recept (tidigare MLflow-pipelines) som AutoML, justering av hyperparameter och klassificeringsstöd, samt moderniserade integreringar med ML-ekosystemet, ett effektiviserat användargränssnitt för MLflow Tracking, en uppdatering av kärn-API:er i MLflows plattformskomponenter med mera. Mer information finns i MLflow 2.0-dokumentationen eller i blogginlägget.
scikit-learn
1.0
Databricks Runtime ML 12.0 innehåller scikit-learn
version 1.0. Gå till dokumentationen scikit-learn
för att lära dig mer om ändringar med den här scikit-learn-versionen.
Systemmiljö
Systemmiljön i Databricks Runtime 12.0 ML skiljer sig från Databricks Runtime 12.0 på följande sätt:
-
DBUtils: Databricks Runtime ML innehåller inte biblioteksverktyget (dbutils.library) (äldre).
Använd
%pip
kommandon i stället. Se Python-bibliotek med notebook-omfång. - För GPU-kluster innehåller Databricks Runtime ML följande NVIDIA GPU-bibliotek:
- CUDA 11.3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
Databricks Runtime 12.0 ML innehåller XGBoost 1.6.2, som inte stöder GPU-kluster med beräkningskapacitet 5.2 och lägre.
Bibliotek
I följande avsnitt visas de bibliotek som ingår i Databricks Runtime 12.0 ML som skiljer sig från de som ingår i Databricks Runtime 12.0.
I detta avsnitt:
- Bibliotek på den översta nivån
- Python-bibliotek
- R-bibliotek
- Java- och Scala-bibliotek (Scala 2.12-kluster)
Bibliotek på den översta nivån
Databricks Runtime 12.0 ML innehåller följande bibliotek på den översta nivån:
- GraphFrames
- Horovod och HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector
- TensorFlow
- TensorBoard
- Scikit-learn
Python-bibliotek
Databricks Runtime 12.0 ML använder Virtualenv för Python-pakethantering och innehåller många populära ML-paket.
Förutom de paket som anges i följande avsnitt innehåller Databricks Runtime 12.0 ML även följande paket:
- hyperopt 0.2.7.db1
- sparkdl 2.3.0-db3
- automl 1.14.1
Om du vill återskapa Databricks Runtime ML Python-miljön i din lokala virtuella Python-miljö laddar du ned filen requirements-12.0.txt och kör pip install -r requirements-12.0.txt
. Det här kommandot installerar alla öppen källkod bibliotek som Databricks Runtime ML använder, men installerar inte bibliotek som utvecklats av Databricks, till exempel databricks-automl
, databricks-feature-store
eller Databricks-förgreningen för hyperopt
.
Python-bibliotek i CPU-kluster
Bibliotek | Version | Bibliotek | Version | Bibliotek | Version |
---|---|---|---|---|---|
absl-py | 1.0.0 | argon2-cffi | 21.3.0 | argon2-cffi-bindningar | 21.2.0 |
Astor | 0.8.1 | asttokens | 2.0.5 | astunparse | 1.6.3 |
attrs | 21.4.0 | azure-core | 1.26.1 | azure-cosmos | 4.2.0 |
backcall | 0.2.0 | backports.entry-points-selectable | 1.2.0 | bcrypt | 3.2.0 |
beautifulsoup4 | 4.11.1 | svart | 22.3.0 | blekmedel | 4.1.0 |
blis | 0.7.9 | boto3 | 1.21.32 | botocore | 1.24.32 |
cachetools | 4.2.2 | katalog | 2.0.8 | kategorikodare | 2.5.1.post0 |
certifi | 2021.10.8 | cffi | 1.15.0 | chardet | 4.0.0 |
charset-normalizer | 2.0.4 | klicka | 8.0.4 | cloudpickle | 2.0.0 |
cmdstanpy | 1.0.8 | konfekt | 0.0.3 | configparser | 5.2.0 |
konvertera | 2.4.0 | kryptografi | 3.4.8 | cyklist | 0.11.0 |
cymem | 2.0.7 | Cython | 0.29.28 | databricks-automl-runtime | 0.2.13 |
databricks-cli | 0.17.3 | databricks-feature-store | 0.8.0 | dbl-tempo | 0.1.12 |
dbus-python | 1.2.16 | felsökning | 1.5.1 | dekoratör | 5.1.1 |
defusedxml | 0.7.1 | dill | 0.3.4 | diskcache | 5.4.0 |
distlib | 0.3.6 | entrypoints | 0,4 | efem | 4.1.3 |
Verkställande | 0.8.3 | facets-overview | 1.0.0 | fastjsonschema | 2.16.2 |
snabbtext | 0.9.2 | filelock | 3.6.0 | Flask | 1.1.2 |
flatbuffers | 22.10.26 | fonttools | 4.25.0 | fsspec | 2022.2.0 |
framtid | 0.18.2 | Gast | 0.4.0 | gitdb | 4.0.9 |
GitPython | 3.1.27 | google-auth | 1.33.0 | google-auth-oauthlib | 0.4.6 |
google-pasta | 0.2.0 | grpcio | 1.42.0 | gunicorn | 20.1.0 |
gviz-api | 1.10.0 | h5py | 3.6.0 | hijri-converter | 2.2.4 |
ferier | 0,16 | horovod | 0.25.0 | htmlmin | 0.1.12 |
huggingface-hub | 0.11.0 | idna | 3.3 | ImageHash | 4.3.1 |
obalanserad inlärning | 0.8.1 | importlib-metadata | 4.11.3 | ipykernel | 6.15.3 |
ipython | 8.5.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.7.2 |
isodate | 0.6.1 | itsdangerous | 2.0.1 | jedi | 0.18.1 |
Jinja2 | 2.11.3 | jmespath | 0.10.0 | joblib | 1.1.0 |
joblibspark | 0.5.0 | jsonschema | 4.4.0 | jupyter-client | 6.1.12 |
jupyter_core | 4.11.2 | jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
keras | 2.10.0 | Keras-förbearbetning | 1.1.2 | kiwisolver | 1.3.2 |
korean-lunar-calendar | 0.3.1 | langcodes | 3.3.0 | libclang | 14.0.6 |
lightgbm | 3.3.3 | llvmlite | 0.38.0 | LunarCalendar | 0.0.9 |
Mako | 1.2.0 | Markdown | 3.3.4 | MarkupSafe | 2.0.1 |
matplotlib | 3.5.1 | matplotlib-inline | 0.1.2 | missingno | 0.5.1 |
mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 2.0.1 |
multimethod | 1.8 | murmurhash | 1.0.9 | mypy-extensions | 0.4.3 |
nbclient | 0.5.13 | nbconvert | 6.4.4 | nbformat | 5.3.0 |
nest-asyncio | 1.5.5 | networkx | 2.7.1 | nltk | 3.7 |
notebook-fil | 6.4.8 | numba | 0.55.1 | numpy | 1.21.5 |
oauthlib | 3.2.0 | opt-einsum | 3.3.0 | emballage | 21,3 |
Pandas | 1.4.2 | pandas-profilering | 3.3.0 | pandocfilter | 1.5.0 |
paramiko | 2.9.2 | parso | 0.8.3 | pathspec | 0.9.0 |
Pati | 0.6.1 | Patsy | 0.5.2 | petastorm | 0.11.4 |
pexpect | 4.8.0 | phik | 0.12.2 | pickleshare | 0.7.5 |
Kudde | 9.0.1 | pip | 21.2.4 | platformdirs | 2.5.4 |
plotly | 5.6.0 | pmdarima | 2.0.1 | fördefinierad | 3.0.8 |
prometheus-client | 0.13.1 | prompt-toolkit | 3.0.20 | profet | 1.1.1 |
protobuf | 3.19.4 | psutil | 5.8.0 | psycopg2 | 2.9.3 |
ptyprocess | 0.7.0 | pure-eval | 0.2.2 | pyarrow | 7.0.0 |
pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pybind11 | 2.10.1 |
pycparser | 2.21 | pydantisk | 1.9.2 | Pygments | 2.11.2 |
PyGObject | 3.36.0 | PyJWT | 2.6.0 | PyMeeus | 0.5.11 |
PyNaCl | 1.5.0 | pyodbc | 4.0.32 | pyparsing | 3.0.4 |
pyrsistent | 0.18.0 | python-dateutil | 2.8.2 | python-editor | 1.0.4 |
pytz | 2021.3 | PyWavelets | 1.3.0 | PyYAML | 6,0 |
pyzmq | 22.3.0 | regex | 2022.3.15 | begäranden | 2.27.1 |
requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 | RSA | 4.7.2 |
s3transfer | 0.5.0 | scikit-learn | 1.0.2 | scipy | 1.7.3 |
seaborn | 0.11.2 | Send2Trash | 1.8.0 | setuptools | 61.2.0 |
setuptools-git | 1.2 | Shap | 0.41.0 | simplejson | 3.17.6 |
sex | 1.16.0 | Slicer | 0.0.7 | smart-open | 5.1.0 |
smmap | 5.0.0 | soupsieve | 2.3.1 | spacy | 3.4.1 |
spacy-legacy | 3.0.10 | spacy-loggers | 1.0.3 | spark-tensorflow-distributor | 1.0.0 |
sqlparse | 0.4.2 | srsly | 2.4.5 | ssh-import-id | 5,10 |
stack-data | 0.2.0 | statsmodels | 0.13.2 | Tabellform | 0.8.9 |
trasslig upp-i-unicode | 0.2.0 | orubblighet | 8.0.1 | tensorboard | 2.10.0 |
tensorboard-data-server | 0.6.1 | tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 |
tensorflow-cpu | 2.10.0 | tensorflow-estimator | 2.10.0 | tensorflow-io-gcs-filesystem | 0.28.0 |
termcolor | 2.1.1 | terminado | 0.13.1 | testpath | 0.5.0 |
thinc | 8.1.5 | threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 |
tokenizers | 0.13.2 | tomli | 1.2.2 | fackla | 1.12.1+cpu |
torchvision | 0.13.1+cpu | tromb | 6.1 | tqdm | 4.64.0 |
traitlets | 5.1.1 | Transformatorer | 4.23.1 | typer | 0.4.2 |
typing_extensions | 4.1.1 | obevakade uppgraderingar | 0,1 | urllib3 | 1.26.9 |
virtualenv | 20.8.0 | Visioner | 0.7.5 | Wasabi | 0.10.1 |
wcwidth | 0.2.5 | webencodings | 0.5.1 | websocket-client | 0.58.0 |
Werkzeug | 2.0.3 | hjul | 0.37.1 | widgetsnbextension | 3.6.1 |
wrapt | 1.12.1 | zipp | 3.7.0 |
Python-bibliotek i GPU-kluster
Bibliotek | Version | Bibliotek | Version | Bibliotek | Version |
---|---|---|---|---|---|
absl-py | 1.0.0 | argon2-cffi | 21.3.0 | argon2-cffi-bindningar | 21.2.0 |
Astor | 0.8.1 | asttokens | 2.0.5 | astunparse | 1.6.3 |
attrs | 21.4.0 | azure-core | 1.26.1 | azure-cosmos | 4.2.0 |
backcall | 0.2.0 | backports.entry-points-selectable | 1.2.0 | bcrypt | 3.2.0 |
beautifulsoup4 | 4.11.1 | svart | 22.3.0 | blekmedel | 4.1.0 |
blis | 0.7.9 | boto3 | 1.21.32 | botocore | 1.24.32 |
cachetools | 4.2.2 | katalog | 2.0.8 | kategorikodare | 2.5.1.post0 |
certifi | 2021.10.8 | cffi | 1.15.0 | chardet | 4.0.0 |
charset-normalizer | 2.0.4 | klicka | 8.0.4 | cloudpickle | 2.0.0 |
cmdstanpy | 1.0.8 | konfekt | 0.0.3 | configparser | 5.2.0 |
konvertera | 2.4.0 | kryptografi | 3.4.8 | cyklist | 0.11.0 |
cymem | 2.0.7 | Cython | 0.29.28 | databricks-automl-runtime | 0.2.13 |
databricks-cli | 0.17.3 | databricks-feature-store | 0.8.0 | dbl-tempo | 0.1.12 |
dbus-python | 1.2.16 | felsökning | 1.5.1 | dekoratör | 5.1.1 |
defusedxml | 0.7.1 | dill | 0.3.4 | diskcache | 5.4.0 |
distlib | 0.3.6 | entrypoints | 0,4 | efem | 4.1.3 |
Verkställande | 0.8.3 | facets-overview | 1.0.0 | fastjsonschema | 2.16.2 |
snabbtext | 0.9.2 | filelock | 3.6.0 | Flask | 1.1.2 |
flatbuffers | 22.10.26 | fonttools | 4.25.0 | fsspec | 2022.2.0 |
framtid | 0.18.2 | Gast | 0.4.0 | gitdb | 4.0.9 |
GitPython | 3.1.27 | google-auth | 1.33.0 | google-auth-oauthlib | 0.4.6 |
google-pasta | 0.2.0 | grpcio | 1.42.0 | gunicorn | 20.1.0 |
gviz-api | 1.10.0 | h5py | 3.6.0 | hijri-converter | 2.2.4 |
ferier | 0,16 | horovod | 0.25.0 | htmlmin | 0.1.12 |
huggingface-hub | 0.11.0 | idna | 3.3 | ImageHash | 4.3.1 |
obalanserad inlärning | 0.8.1 | importlib-metadata | 4.11.3 | ipykernel | 6.15.3 |
ipython | 8.5.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.7.2 |
isodate | 0.6.1 | itsdangerous | 2.0.1 | jedi | 0.18.1 |
Jinja2 | 2.11.3 | jmespath | 0.10.0 | joblib | 1.1.0 |
joblibspark | 0.5.0 | jsonschema | 4.4.0 | jupyter-client | 6.1.12 |
jupyter_core | 4.11.2 | jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
keras | 2.10.0 | Keras-förbearbetning | 1.1.2 | kiwisolver | 1.3.2 |
korean-lunar-calendar | 0.3.1 | langcodes | 3.3.0 | libclang | 14.0.6 |
lightgbm | 3.3.3 | llvmlite | 0.38.0 | LunarCalendar | 0.0.9 |
Mako | 1.2.0 | Markdown | 3.3.4 | MarkupSafe | 2.0.1 |
matplotlib | 3.5.1 | matplotlib-inline | 0.1.2 | missingno | 0.5.1 |
mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 2.0.1 |
multimethod | 1.8 | murmurhash | 1.0.9 | mypy-extensions | 0.4.3 |
nbclient | 0.5.13 | nbconvert | 6.4.4 | nbformat | 5.3.0 |
nest-asyncio | 1.5.5 | networkx | 2.7.1 | nltk | 3.7 |
notebook-fil | 6.4.8 | numba | 0.55.1 | numpy | 1.21.5 |
oauthlib | 3.2.0 | opt-einsum | 3.3.0 | emballage | 21,3 |
Pandas | 1.4.2 | pandas-profilering | 3.3.0 | pandocfilter | 1.5.0 |
paramiko | 2.9.2 | parso | 0.8.3 | pathspec | 0.9.0 |
Pati | 0.6.1 | Patsy | 0.5.2 | petastorm | 0.11.4 |
pexpect | 4.8.0 | phik | 0.12.2 | pickleshare | 0.7.5 |
Kudde | 9.0.1 | pip | 21.2.4 | platformdirs | 2.5.4 |
plotly | 5.6.0 | pmdarima | 2.0.1 | fördefinierad | 3.0.8 |
prompt-toolkit | 3.0.20 | profet | 1.1.1 | protobuf | 3.19.4 |
psutil | 5.8.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
pure-eval | 0.2.2 | pyarrow | 7.0.0 | pyasn1 | 0.4.8 |
pyasn1-modules | 0.2.8 | pybind11 | 2.10.1 | pycparser | 2.21 |
pydantisk | 1.9.2 | Pygments | 2.11.2 | PyGObject | 3.36.0 |
PyJWT | 2.6.0 | PyMeeus | 0.5.11 | PyNaCl | 1.5.0 |
pyodbc | 4.0.32 | pyparsing | 3.0.4 | pyrsistent | 0.18.0 |
python-dateutil | 2.8.2 | python-editor | 1.0.4 | pytz | 2021.3 |
PyWavelets | 1.3.0 | PyYAML | 6,0 | pyzmq | 22.3.0 |
regex | 2022.3.15 | begäranden | 2.27.1 | requests-oauthlib | 1.3.1 |
requests-unixsocket | 0.2.0 | RSA | 4.7.2 | s3transfer | 0.5.0 |
scikit-learn | 1.0.2 | scipy | 1.7.3 | seaborn | 0.11.2 |
Send2Trash | 1.8.0 | setuptools | 61.2.0 | setuptools-git | 1.2 |
Shap | 0.41.0 | simplejson | 3.17.6 | sex | 1.16.0 |
Slicer | 0.0.7 | smart-open | 5.1.0 | smmap | 5.0.0 |
soupsieve | 2.3.1 | spacy | 3.4.1 | spacy-legacy | 3.0.10 |
spacy-loggers | 1.0.3 | spark-tensorflow-distributor | 1.0.0 | sqlparse | 0.4.2 |
srsly | 2.4.5 | ssh-import-id | 5,10 | stack-data | 0.2.0 |
statsmodels | 0.13.2 | Tabellform | 0.8.9 | trasslig upp-i-unicode | 0.2.0 |
orubblighet | 8.0.1 | tensorboard | 2.10.0 | tensorboard-data-server | 0.6.1 |
tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 | tensorflow | 2.10.0 |
tensorflow-estimator | 2.10.0 | tensorflow-io-gcs-filesystem | 0.28.0 | termcolor | 2.1.1 |
terminado | 0.13.1 | testpath | 0.5.0 | thinc | 8.1.5 |
threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 | tokenizers | 0.13.2 |
tomli | 1.2.2 | fackla | 1.12.1+cu113 | torchvision | 0.13.1+cu113 |
tromb | 6.1 | tqdm | 4.64.0 | traitlets | 5.1.1 |
Transformatorer | 4.23.1 | typer | 0.4.2 | typing_extensions | 4.1.1 |
obevakade uppgraderingar | 0,1 | urllib3 | 1.26.9 | virtualenv | 20.8.0 |
Visioner | 0.7.5 | Wasabi | 0.10.1 | wcwidth | 0.2.5 |
webencodings | 0.5.1 | websocket-client | 0.58.0 | Werkzeug | 2.0.3 |
hjul | 0.37.1 | widgetsnbextension | 3.6.1 | wrapt | 1.12.1 |
zipp | 3.7.0 |
R-bibliotek
R-biblioteken är identiska med R-biblioteken i Databricks Runtime 12.0.
Java- och Scala-bibliotek (Scala 2.12-kluster)
Förutom Java- och Scala-bibliotek i Databricks Runtime 12.0 innehåller Databricks Runtime 12.0 ML följande JAR:er:
CPU-kluster
Grupp-ID | Artefakt-ID | Version |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-spark_2.12 | 1.6.2 |
ml.dmlc | xgboost4j_2.12 | 1.6.2 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 2.0.1 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
GPU-kluster
Grupp-ID | Artefakt-ID | Version |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-gpu_2.12 | 1.6.2 |
ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.6.2 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 2.0.1 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |