Databricks Runtime 12.2 LTS pro Machine Learning
Databricks Runtime 12.2 LTS for Machine Learning poskytuje připravené prostředí pro strojové učení a datové vědy založené na databricks Runtime 12.2 LTS. Databricks Runtime ML obsahuje mnoho oblíbených knihoven strojového učení, včetně TensorFlow, PyTorch a XGBoost. Databricks Runtime ML zahrnuje AutoML, nástroj pro automatické trénování kanálů strojového učení. Databricks Runtime ML také podporuje distribuované trénování hlubokého učení pomocí Horovodu.
Poznámka:
LTS znamená, že tato verze je dlouhodobě podporována. Viz životní cyklus verze LTS modulu Databricks Runtime.
Další informace, včetně pokynů k vytvoření clusteru Databricks Runtime ML, najdete v tématu AI a strojové učení v Databricks.
Tip
Poznámky k verzi pro verze Databricks Runtime, které dosáhly konce podpory (EoS), najdete v poznámkách k verzi Databricks Runtime pro ukončení podpory. Verze EoS Databricks Runtime byly vyřazeny a nemusí se aktualizovat.
Nové funkce a vylepšení
Databricks Runtime 12.2 LTS ML je postaven na Databricks Runtime 12.2 LTS. Informace o novinkách v Databricks Runtime 12.2 LTS, včetně Apache Spark MLlib a SparkR, najdete v poznámkách k verzi Databricks Runtime 12.2 LTS .
AutoML
Můžete použít stávající vlastnost tables v úložišti vlastností k rozšíření původní vstupní datové sady pro prognostické problémy v AutoML. Podrobnosti najdete v tématu Integrace úložiště funkcí AutoML.
Další informace o AutoML naleznete v tématu Co je AutoML?.
Prostředí systému
Systémové prostředí v Databricks Runtime 12.2 LTS ML se liší od Databricks Runtime 12.2 LTS následujícím způsobem:
-
DBUtils: Databricks Runtime ML nezahrnuje nástroj knihovny (dbutils.library) (starší verze).
Místo toho použijte
%pip
příkazy. Další informace najdete v tématu Knihovny Pythonu v rámci poznámkových bloků - Pro clustery GPU zahrnuje Databricks Runtime ML následující knihovny NVIDIA GPU:
- CUDA 11.3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
Databricks Runtime 12.2 LTS ML zahrnuje XGBoost 1.7.2, který nepodporuje clustery GPU s výpočetní schopností 5.2 a nižší.
Knihovny
Následující části list knihovny zahrnuté v Databricks Runtime 12.2 LTS ML, které se liší od knihoven zahrnutých v Databricks Runtime 12.2 LTS.
V této části:
- Knihovny nejvyšší úrovně
- Knihovny Pythonu
- Knihovny jazyka R
- Knihovny Java a Scala (cluster Scala 2.12)
Knihovny nejvyšší úrovně
Databricks Runtime 12.2 LTS ML obsahuje následující knihovny nejvyšší úrovně:
- GraphFrames
- Horovod a HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector
- TensorFlow
- TensorBoard
- Scikit-learn
Knihovny Pythonu
Databricks Runtime 12.2 LTS ML používá Virtualenv ke správě balíčků Pythonu a obsahuje mnoho oblíbených balíčků ML.
Kromě balíčků uvedených v následujících částech obsahuje Databricks Runtime 12.2 LTS ML také následující balíčky:
- hyperopt 0.2.7+db3
- sparkdl 2.3.0-db3
- automl 1.16.0
Pokud chcete reprodukovat prostředí Databricks Runtime ML Python v místním virtuálním prostředí Pythonu, stáhněte si soubor requirements-12.2.txt a spusťte pip install -r requirements-12.2.txt
. Tento příkaz nainstaluje všechny opensourcové knihovny, které databricks Runtime ML používá, ale neinstaluje knihovny vyvinuté službou Databricks, například databricks-automl
, databricks-feature-store
nebo fork Databricks fork hyperopt
.
Knihovny Pythonu v clusterech procesorů
Knihovna | Verze | Knihovna | Verze | Knihovna | Verze |
---|---|---|---|---|---|
absl-py | 1.0.0 | argon2-cffi | 21.3.0 | argon2-cffi-bindings | 21.2.0 |
Astor | 0.8.1 | asttokens | 2.0.5 | astunparse | 1.6.3 |
attrs | 21.4.0 | Azure-Core | 1.26.3 | azure-cosmos | 4.2.0 |
backcall | 0.2.0 | backports.entry-points-selectable | 1.2.0 | šifra | 3.2.0 |
krásnásoup4 | 4.11.1 | černý | 22.3.0 | bělit | 4.1.0 |
blis | 0.7.9 | boto3 | 1.21.32 | botocore | 1.24.32 |
cachetools | 4.2.2 | katalog | 2.0.8 | kodéry kategorií | 2.5.1.post0 |
certifi | 2021.10.8 | cffi | 1.15.0 | chardet | 4.0.0 |
charset-normalizer | 2.0.4 | kliknutí | 8.0.4 | cloudpickle | 2.0.0 |
cmdstanpy | 1.1.0 | cukroví | 0.0.4 | configparser | 5.2.0 |
convertdate | 2.4.0 | kryptografie | 3.4.8 | cyklista | 0.11.0 |
cymem | 2.0.7 | Cython | 0.29.28 | databricks-automl-runtime | 0.2.15 |
Databricks-cli | 0.17.4 | Úložiště funkcí databricks | 0.10.0 | dbl-tempo | 0.1.12 |
dbus-python | 1.2.16 | ladění | 1.5.1 | dekoratér | 5.1.1 |
defusedxml | 0.7.1 | kopr | 0.3.4 | diskcache | 5.4.0 |
distlib | 0.3.6 | docstring-to-markdown | 0,11 | vstupní body | 0,4 |
ephem | 4.1.4 | vykonávající | 0.8.3 | přehled omezujících vlastností | 1.0.0 |
fastjsonschema | 2.16.2 | fasttext | 0.9.2 | filelock | 3.6.0 |
Flask | 1.1.2 | flatbuffers | 23.1.21 | fonttools | 4.25.0 |
fsspec | 2022.2.0 | budoucnost | 0.18.2 | Gast | 0.4.0 |
gitdb | 4.0.10 | GitPython | 3.1.27 | google-auth | 1.33.0 |
google-auth-oauthlib | 0.4.6 | google-pasta | 0.2.0 | grpcio | 1.42.0 |
gunicorn | 20.1.0 | gviz-api | 1.10.0 | h5py | 3.6.0 |
hijri-converter | 2.2.4 | prázdniny | 0,18 | horovod | 0.27.0 |
htmlmin | 0.1.12 | huggingface-hub | 0.12.0 | idna | 3.3 |
ImageHash | 4.3.1 | nevyvážené učení | 0.10.1 | importlib-metadata | 4.11.3 |
ipykernel | 6.15.3 | ipython | 8.5.0 | ipython-genutils | 0.2.0 |
ipywidgets | 7.7.2 | isodate | 0.6.1 | jehodangerous | 2.0.1 |
Jedi | 0.18.1 | Jinja2 | 2.11.3 | jmespath | 0.10.0 |
joblib | 1.1.1 | joblibspark | 0.5.1 | jsonschema | 4.4.0 |
jupyter-client | 6.1.12 | jupyter_core | 4.11.2 | jupyterlab-pygments | 0.1.2 |
jupyterlab-widgety | 1.0.0 | keras | 2.11.0 | verizonsolver | 1.3.2 |
korejský lunární kalendář | 0.3.1 | langcodes | 3.3.0 | libclang | 15.0.6.1 |
lightgbm | 3.3.4 | llvmlite | 0.38.0 | LunárníCalendar | 0.0.9 |
Druh žraloka | 1.2.0 | Markdown | 3.3.4 | MarkupSafe | 2.0.1 |
matplotlib | 3.5.1 | matplotlib-inline | 0.1.2 | Mccabe | 0.7.0 |
špatně zamyšlení | 0.8.4 | mleap | 0.20.0 | mlflow-hubená | 2.1.1 |
multimethod | 1.9.1 | murmurhash | 1.0.9 | mypy-extensions | 0.4.3 |
nbclient | 0.5.13 | nbconvert | 6.4.4 | nbformat | 5.3.0 |
nest-asyncio | 1.5.5 | networkx | 2.7.1 | nltk | 3.7 |
nodeenv | 1.7.0 | poznámkový blok | 6.4.8 | numba | 0.55.1 |
numpy | 1.21.5 | oauthlib | 3.2.0 | opt-einsum | 3.3.0 |
balení | 21.3 | pandas | 1.4.2 | profilace pandas | 3.6.2 |
pandocfilters | 1.5.0 | paramiko | 2.9.2 | parso | 0.8.3 |
pathspec | 0.9.0 | pathy | 0.10.1 | bábovka | 0.5.2 |
petastorm | 0.12.1 | pexpect | 4.8.0 | Phik | 0.12.3 |
pickleshare | 0.7.5 | Polštář | 9.0.1 | jádro | 21.2.4 |
platformdirs | 2.6.2 | plotly | 5.6.0 | pluggy | 1.0.0 |
pmdarima | 2.0.2 | předběžně připravený | 3.0.8 | prometheus-client | 0.13.1 |
prompt-toolkit | 3.0.20 | prorok | 1.1.1 | protobuf | 3.19.4 |
psutil | 5.8.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
čistý-eval | 0.2.2 | pyarrow | 7.0.0 | pyasn1 | 0.4.8 |
pyasn1-modules | 0.2.8 | pybind11 | 2.10.3 | pycparser | 2.21 |
pydantic | 1.10.2 | pyflakes | 2.5.0 | Pygments | 2.11.2 |
PyGObject | 3.36.0 | PyJWT | 2.6.0 | PyMeeus | 0.5.12 |
PyNaCl | 1.5.0 | pyodbc | 4.0.32 | pyparsing | 3.0.4 |
pyright | 1.1.283 | pyrsistent | 0.18.0 | python-dateutil | 2.8.2 |
python-editor | 1.0.4 | python-lsp-jsonrpc | 1.0.0 | python-lsp-server | 1.6.0 |
pytz | 2021.3 | PyWavelets | 1.3.0 | PyYAML | 6.0 |
pyzmq | 22.3.0 | regex | 2022.3.15 | žádosti | 2.27.1 |
requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 | lano | 0.22.0 |
rsa | 4.7.2 | s3transfer | 0.5.0 | scikit-learn | 1.0.2 |
scipy | 1.7.3 | seaborn | 0.11.2 | Send2Trash | 1.8.0 |
setuptools | 61.2.0 | setuptools-git | 1.2 | Shap | 0.41.0 |
simplejson | 3.17.6 | Šest | 1.16.0 | kráječ | 0.0.7 |
inteligentní otevření | 5.2.1 | smmap | 5.0.0 | polévky | 2.3.1 |
spacy | 3.4.4 | spacy-legacy | 3.0.12 | spacy-loggers | 1.0.4 |
spark-tensorflow-distributor | 1.0.0 | sqlparse | 0.4.2 | srsly | 2.4.5 |
ssh-import-id | 5.10 | stack-data | 0.2.0 | statsmodels | 0.13.2 |
sestavit v tabulku | 0.8.9 | tangled-up-in-unicode | 0.2.0 | houževnatost | 8.0.1 |
tensorboard | 2.11.2 | tensorboard-data-server | 0.6.1 | tensorboard-plugin-profile | 2.11.1 |
tensorboard-plugin-wit | 1.8.1 | tensorflow-cpu | 2.11.0 | tensorflow-estimator | 2.11.0 |
tensorflow-io-gcs-filesystem | 0.30.0 | termcolor | 2.2.0 | terminado | 0.13.1 |
testpath | 0.5.0 | tenká | 8.1.7 | threadpoolctl | 2.2.0 |
tokenize-rt | 4.2.1 | tokenizátory | 0.13.2 | tomli | 1.2.2 |
pochodeň | 1.13.1+cpu | torchvision | 0.14.1+cpu | tornádo | 6.1 |
tqdm | 4.64.0 | vlastnosti | 5.1.1 | Transformátory | 4.25.1 |
typeguard | 2.13.3 | Typer | 0.7.0 | typing_extensions | 4.1.1 |
ujson | 5.1.0 | bezobslužné upgrady | 0,1 | urllib3 | 1.26.9 |
virtualenv | 20.8.0 | vize | 0.7.5 | wasabi | 0.10.1 |
wcwidth | 0.2.5 | webencodings | 0.5.1 | websocket-client | 0.58.0 |
Werkzeug | 2.0.3 | whatthepatch | 1.0.4 | kolo | 0.37.1 |
widgetsnbextension | 3.6.1 | wrapt | 1.12.1 | xgboost | 1.7.2 |
yapf | 0.31.0 | zipp | 3.7.0 |
Knihovny Pythonu v clusterech GPU
Knihovna | Verze | Knihovna | Verze | Knihovna | Verze |
---|---|---|---|---|---|
absl-py | 1.0.0 | argon2-cffi | 21.3.0 | argon2-cffi-bindings | 21.2.0 |
Astor | 0.8.1 | asttokens | 2.0.5 | astunparse | 1.6.3 |
attrs | 21.4.0 | Azure-Core | 1.26.3 | azure-cosmos | 4.2.0 |
backcall | 0.2.0 | backports.entry-points-selectable | 1.2.0 | šifra | 3.2.0 |
krásnásoup4 | 4.11.1 | černý | 22.3.0 | bělit | 4.1.0 |
blis | 0.7.9 | boto3 | 1.21.32 | botocore | 1.24.32 |
cachetools | 4.2.2 | katalog | 2.0.8 | kodéry kategorií | 2.5.1.post0 |
certifi | 2021.10.8 | cffi | 1.15.0 | chardet | 4.0.0 |
charset-normalizer | 2.0.4 | kliknutí | 8.0.4 | cloudpickle | 2.0.0 |
cmdstanpy | 1.1.0 | cukroví | 0.0.4 | configparser | 5.2.0 |
convertdate | 2.4.0 | kryptografie | 3.4.8 | cyklista | 0.11.0 |
cymem | 2.0.7 | Cython | 0.29.28 | databricks-automl-runtime | 0.2.15 |
Databricks-cli | 0.17.4 | Úložiště funkcí databricks | 0.10.0 | dbl-tempo | 0.1.12 |
dbus-python | 1.2.16 | ladění | 1.5.1 | dekoratér | 5.1.1 |
defusedxml | 0.7.1 | kopr | 0.3.4 | diskcache | 5.4.0 |
distlib | 0.3.6 | docstring-to-markdown | 0,11 | vstupní body | 0,4 |
ephem | 4.1.4 | vykonávající | 0.8.3 | přehled omezujících vlastností | 1.0.0 |
fastjsonschema | 2.16.2 | fasttext | 0.9.2 | filelock | 3.6.0 |
Flask | 1.1.2 | flatbuffers | 23.1.21 | fonttools | 4.25.0 |
fsspec | 2022.2.0 | budoucnost | 0.18.2 | Gast | 0.4.0 |
gitdb | 4.0.10 | GitPython | 3.1.27 | google-auth | 1.33.0 |
google-auth-oauthlib | 0.4.6 | google-pasta | 0.2.0 | grpcio | 1.42.0 |
gunicorn | 20.1.0 | gviz-api | 1.10.0 | h5py | 3.6.0 |
hijri-converter | 2.2.4 | prázdniny | 0,18 | horovod | 0.27.0 |
htmlmin | 0.1.12 | huggingface-hub | 0.12.0 | idna | 3.3 |
ImageHash | 4.3.1 | nevyvážené učení | 0.10.1 | importlib-metadata | 4.11.3 |
ipykernel | 6.15.3 | ipython | 8.5.0 | ipython-genutils | 0.2.0 |
ipywidgets | 7.7.2 | isodate | 0.6.1 | jehodangerous | 2.0.1 |
Jedi | 0.18.1 | Jinja2 | 2.11.3 | jmespath | 0.10.0 |
joblib | 1.1.1 | joblibspark | 0.5.1 | jsonschema | 4.4.0 |
jupyter-client | 6.1.12 | jupyter_core | 4.11.2 | jupyterlab-pygments | 0.1.2 |
jupyterlab-widgety | 1.0.0 | keras | 2.11.0 | verizonsolver | 1.3.2 |
korejský lunární kalendář | 0.3.1 | langcodes | 3.3.0 | libclang | 15.0.6.1 |
lightgbm | 3.3.4 | llvmlite | 0.38.0 | LunárníCalendar | 0.0.9 |
Druh žraloka | 1.2.0 | Markdown | 3.3.4 | MarkupSafe | 2.0.1 |
matplotlib | 3.5.1 | matplotlib-inline | 0.1.2 | Mccabe | 0.7.0 |
špatně zamyšlení | 0.8.4 | mleap | 0.20.0 | mlflow-hubená | 2.1.1 |
multimethod | 1.9.1 | murmurhash | 1.0.9 | mypy-extensions | 0.4.3 |
nbclient | 0.5.13 | nbconvert | 6.4.4 | nbformat | 5.3.0 |
nest-asyncio | 1.5.5 | networkx | 2.7.1 | nltk | 3.7 |
nodeenv | 1.7.0 | poznámkový blok | 6.4.8 | numba | 0.55.1 |
numpy | 1.21.5 | oauthlib | 3.2.0 | opt-einsum | 3.3.0 |
balení | 21.3 | pandas | 1.4.2 | profilace pandas | 3.6.2 |
pandocfilters | 1.5.0 | paramiko | 2.9.2 | parso | 0.8.3 |
pathspec | 0.9.0 | pathy | 0.10.1 | bábovka | 0.5.2 |
petastorm | 0.12.1 | pexpect | 4.8.0 | Phik | 0.12.3 |
pickleshare | 0.7.5 | Polštář | 9.0.1 | jádro | 21.2.4 |
platformdirs | 2.6.2 | plotly | 5.6.0 | pluggy | 1.0.0 |
pmdarima | 2.0.2 | předběžně připravený | 3.0.8 | prompt-toolkit | 3.0.20 |
prorok | 1.1.1 | protobuf | 3.19.4 | psutil | 5.8.0 |
psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | čistý-eval | 0.2.2 |
pyarrow | 7.0.0 | pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 |
pybind11 | 2.10.3 | pycparser | 2.21 | pydantic | 1.10.2 |
pyflakes | 2.5.0 | Pygments | 2.11.2 | PyGObject | 3.36.0 |
PyJWT | 2.6.0 | PyMeeus | 0.5.12 | PyNaCl | 1.5.0 |
pyodbc | 4.0.32 | pyparsing | 3.0.4 | pyright | 1.1.283 |
pyrsistent | 0.18.0 | python-dateutil | 2.8.2 | python-editor | 1.0.4 |
python-lsp-jsonrpc | 1.0.0 | python-lsp-server | 1.6.0 | pytz | 2021.3 |
PyWavelets | 1.3.0 | PyYAML | 6.0 | pyzmq | 22.3.0 |
regex | 2022.3.15 | žádosti | 2.27.1 | requests-oauthlib | 1.3.1 |
requests-unixsocket | 0.2.0 | lano | 0.22.0 | rsa | 4.7.2 |
s3transfer | 0.5.0 | scikit-learn | 1.0.2 | scipy | 1.7.3 |
seaborn | 0.11.2 | Send2Trash | 1.8.0 | setuptools | 61.2.0 |
setuptools-git | 1.2 | Shap | 0.41.0 | simplejson | 3.17.6 |
Šest | 1.16.0 | kráječ | 0.0.7 | inteligentní otevření | 5.2.1 |
smmap | 5.0.0 | polévky | 2.3.1 | spacy | 3.4.4 |
spacy-legacy | 3.0.12 | spacy-loggers | 1.0.4 | spark-tensorflow-distributor | 1.0.0 |
sqlparse | 0.4.2 | srsly | 2.4.5 | ssh-import-id | 5.10 |
stack-data | 0.2.0 | statsmodels | 0.13.2 | sestavit v tabulku | 0.8.9 |
tangled-up-in-unicode | 0.2.0 | houževnatost | 8.0.1 | tensorboard | 2.11.2 |
tensorboard-data-server | 0.6.1 | tensorboard-plugin-profile | 2.11.1 | tensorboard-plugin-wit | 1.8.1 |
tensorflow | 2.11.0 | tensorflow-estimator | 2.11.0 | tensorflow-io-gcs-filesystem | 0.30.0 |
termcolor | 2.2.0 | terminado | 0.13.1 | testpath | 0.5.0 |
tenká | 8.1.7 | threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 |
tokenizátory | 0.13.2 | tomli | 1.2.2 | pochodeň | 1.13.1+cu117 |
torchvision | 0.14.1+cu117 | tornádo | 6.1 | tqdm | 4.64.0 |
vlastnosti | 5.1.1 | Transformátory | 4.25.1 | typeguard | 2.13.3 |
Typer | 0.7.0 | typing_extensions | 4.1.1 | ujson | 5.1.0 |
bezobslužné upgrady | 0,1 | urllib3 | 1.26.9 | virtualenv | 20.8.0 |
vize | 0.7.5 | wasabi | 0.10.1 | wcwidth | 0.2.5 |
webencodings | 0.5.1 | websocket-client | 0.58.0 | Werkzeug | 2.0.3 |
whatthepatch | 1.0.4 | kolo | 0.37.1 | widgetsnbextension | 3.6.1 |
wrapt | 1.12.1 | xgboost | 1.7.2 | yapf | 0.31.0 |
zipp | 3.7.0 |
Knihovny jazyka R
Knihovny R jsou stejné jako knihovny R v Databricks Runtime 12.2 LTS.
Knihovny Java a Scala (cluster Scala 2.12)
Kromě knihoven Java a Scala v Databricks Runtime 12.2 LTS obsahuje Databricks Runtime 12.2 LTS ML následující žádosti o přijetí změn:
Clustery procesoru
ID skupiny | ID artefaktu | Verze |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-spark_2.12 | 1.7.3 |
ml.dmlc | xgboost4j_2.12 | 1.7.3 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 2.1.1 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
Clustery GPU
ID skupiny | ID artefaktu | Verze |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-gpu_2.12 | 1.7.3 |
ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.7.3 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 2.1.1 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |