Sdílet prostřednictvím


Databricks Runtime 11.2 pro Machine Learning (EoS)

Poznámka:

Podpora této verze Databricks Runtime skončila. Datum ukončení podpory najdete v tématu Historie ukončení podpory. Všechny podporované verze databricks Runtime najdete v poznámkách k verzi Databricks Runtime a kompatibilitu.

Databricks Runtime 11.2 pro Machine Learning poskytuje připravené prostředí pro strojové učení a datové vědy založené na databricks Runtime 11.2 (EoS). Databricks Runtime ML obsahuje mnoho oblíbených knihoven strojového učení, včetně TensorFlow, PyTorch a XGBoost. Databricks Runtime ML zahrnuje AutoML, nástroj pro automatické trénování kanálů strojového učení. Databricks Runtime ML také podporuje distribuované trénování hlubokého učení pomocí Horovodu.

Další informace, včetně pokynů k vytvoření clusteru Databricks Runtime ML, najdete v tématu AI a strojové učení v Databricks.

Nové funkce a vylepšení

Databricks Runtime 11.2 ML je postaven na Databricks Runtime 11.2. Informace o novinkách v Databricks Runtime 11.2, včetně Apache Spark MLlib a SparkR, najdete ve zprávě k vydání verze Databricks Runtime 11.2 (EoS).

Vylepšení autoML

AutoML teď nabízí lepší podporu nevyrovnaných datových sad pro problémy klasifikace. Podrobnosti najdete v tématu Podpora nevyrovnaných datových sad pro problémy klasifikace.

Vylepšení úložiště funkcí Databricks

V úložišti funkcí Databricks jsme provedli následující vylepšení.

  • Pro online obchody jsou pole uživatele a hesla zastaralá. Chcete-li zabránit budoucím nekompatibilitě, změňte všechna použití těchto polí na write_secret_prefix.

  • Veškerá dokumentace a výstup z klienta úložiště funkcí teď odkazují na verzi klienta (například 0.6.1) místo verzí ml databricks Runtime (například 11.2).

Prostředí systému

Systémové prostředí v Databricks Runtime 11.2 ML se liší od Databricks Runtime 11.2 následujícím způsobem:

Knihovny

Následující části obsahují seznam knihoven zahrnutých v Databricks Runtime 11.2 ML, které se liší od knihoven zahrnutých v Databricks Runtime 11.2.

V této části:

Knihovny nejvyšší úrovně

Databricks Runtime 11.2 ML obsahuje následující knihovny nejvyšší úrovně:

Knihovny Pythonu

Databricks Runtime 11.2 ML používá Virtualenv pro správu balíčků Pythonu a obsahuje mnoho oblíbených balíčků ML.

Kromě balíčků zadaných v následujících částech obsahuje Databricks Runtime 11.2 ML také následující balíčky:

  • hyperopt 0.2.7.db1
  • sparkdl 2.2.0_db6
  • feature_store 0.6.0
  • automl 1.12.3

Knihovny Pythonu v clusterech procesorů

Pokud chcete reprodukovat prostředí Databricks Runtime ML Python v místním virtuálním prostředí Pythonu, stáhněte si soubor requirements-11.2.txt a spusťte pip install -r requirements-11.2.txt. Tento příkaz nainstaluje všechny opensourcové knihovny, které Databricks Runtime ML používá, ale nenainstaluje knihovny vyvinuté v Azure Databricks, například databricks-automl, databricks-feature-storenebo fork Databricks fork hyperopt.

Knihovna Verze Knihovna Verze Knihovna Verze
absl-py 1.0.0 Antergos Linux 2015.10 (ISO-Rolling) argon2-cffi 20.1.0
Astor 0.8.1 astunparse 1.6.3 async-generator 1,10
attrs 21.2.0 Azure-Core 1.22.1 azure-cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.1.1 šifra 3.2.2
černý 22.3.0 bělit 4.0.0 blis 0.7.8
boto3 1.21.18 botocore 1.24.18 cachetools 5.2.0
katalog 2.0.8 certifi 2021.10.8 cffi 1.14.6
chardet 4.0.0 charset-normalizer 2.0.4 kliknutí 8.0.3
cloudpickle 2.0.0 cmdstanpy 0.9.68 configparser 5.2.0
convertdate 2.4.0 kryptografie 3.4.8 cyklista 0.10.0
cymem 2.0.6 Cython 0.29.24 databricks-automl-runtime 0.2.10
Databricks-cli 0.17.0 dbl-tempo 0.1.12 dbus-python 1.2.16
ladění 1.4.1 dekoratér 5.1.0 defusedxml 0.7.1
kopr 0.3.4 diskcache 5.4.0 distlib 0.3.5
informace o distribuci 0.23ubuntu1 vstupní body 0.3 ephem 4.1.3
přehled omezujících vlastností 1.0.0 fasttext 0.9.2 filelock 3.3.1
Flask 1.1.2 flatbuffers 1.12 fsspec 2021.8.1
budoucnost 0.18.2 Gast 0.4.0 gitdb 4.0.9
GitPython 3.1.27 google-auth 2.6.0 google-auth-oauthlib 0.4.6
google-pasta 0.2.0 grpcio 1.44.0 gunicorn 20.1.0
gviz-api 1.10.0 h5py 3.3.0 hijri-converter 2.2.4
prázdniny 0.14.2 horovod 0.25.0 htmlmin 0.1.12
huggingface-hub 0.8.1 idna 3.2 ImageHash 4.2.1
nevyvážené učení 0.8.1 importlib-metadata 4.8.1 ipykernel 6.12.1
ipython 7.32.0 ipython-genutils 0.2.0 ipywidgets 7.7.0
isodate 0.6.1 jehodangerous 2.0.1 Jedi 0.18.0
Jinja2 2.11.3 jmespath 0.10.0 joblib 1.0.1
joblibspark 0.5.0 jsonschema 3.2.0 jupyter-client 6.1.12
jupyter-core 4.8.1 jupyterlab-pygments 0.1.2 jupyterlab-widgety 1.0.0
keras 2.9.0 Předběžné zpracování Kerasu 1.1.2 verizonsolver 1.3.1
korejský lunární kalendář 0.2.1 langcodes 3.3.0 libclang 14.0.6
lightgbm 3.3.2 llvmlite 0.37.0 LunárníCalendar 0.0.9
Druh žraloka 1.2.0 Markdown 3.3.6 MarkupSafe 2.0.1
matplotlib 3.4.3 matplotlib-inline 0.1.2 missingno 0.5.1
špatně zamyšlení 0.8.4 mleap 0.20.0 mlflow-hubená 1.28.0
multimethod 1.8 murmurhash 1.0.8 mypy-extensions 0.4.3
nbclient 0.5.3 nbconvert 6.1.0 nbformat 5.1.3
nest-asyncio 1.5.1 networkx 2.6.3 nltk 3.6.5
poznámkový blok 6.4.5 numba 0.54.1 numpy 1.20.3
oauthlib 3.2.0 opt-einsum 3.3.0 balení 21.0
pandas 1.3.4 profilace pandas 3.1.0 pandocfilters 1.4.3
paramiko 2.9.2 parso 0.8.2 pathspec 0.9.0
pathy 0.6.2 bábovka 0.5.2 petastorm 0.11.4
pexpect 4.8.0 Phik 0.12.2 pickleshare 0.7.5
Polštář 8.4.0 jádro 21.2.4 platformdirs 2.5.2
plotly 5.9.0 pmdarima 1.8.5 předběžně připravený 3.0.7
prometheus-client 0.11.0 prompt-toolkit 3.0.20 prorok 1.0.1
protobuf 3.19.4 psutil 5.8.0 psycopg2 2.9.3
ptyprocess 0.7.0 pyarrow 7.0.0 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.10.0 pycparser 2,20
pydantic 1.9.2 Pygments 2.10.0 PyGObject 3.36.0
PyJWT 2.4.0 PyMeeus 0.5.11 PyNaCl 1.5.0
pyodbc 4.0.31 pyparsing 3.0.4 pyrsistent 0.18.0
pystan 2.19.1.1 python-apt 2.0.0+ubuntu0.20.4.7 python-dateutil 2.8.2
python-editor 1.0.4 pytz 2021.3 PyWavelets 1.1.1
PyYAML 6.0 pyzmq 22.2.1 regex 2021.8.3
žádosti 2.26.0 requests-oauthlib 1.3.1 requests-unixsocket 0.2.0
rsa 4,9 s3transfer 0.5.2 scikit-learn 0.24.2
scipy 1.7.1 seaborn 0.11.2 Send2Trash 1.8.0
setuptools 58.0.4 setuptools-git 1.2 Shap 0.41.0
simplejson 3.17.6 Šest 1.16.0 kráječ 0.0.7
inteligentní otevření 5.2.1 smmap 5.0.0 spacy 3.4.0
spacy-legacy 3.0.9 spacy-loggers 1.0.3 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.2 srsly 2.4.4 ssh-import-id 5.10
statsmodels 0.12.2 sestavit v tabulku 0.8.9 tangled-up-in-unicode 0.1.0
houževnatost 8.0.1 tensorboard 2.9.1 tensorboard-data-server 0.6.1
tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1 tensorflow-cpu 2.9.1
tensorflow-estimator 2.9.0 tensorflow-io-gcs-filesystem 0.26.0 termcolor 1.1.0
terminado 0.9.4 testpath 0.5.0 tenká 8.1.0
threadpoolctl 2.2.0 tokenize-rt 4.2.1 tokenizátory 0.12.1
tomli 2.0.1 pochodeň 1.11.0+cpu torchvision 0.12.0+cpu
tornádo 6.1 tqdm 4.62.3 vlastnosti 5.1.0
Transformátory 4.20.1 Typer 0.4.2 typing-extensions 3.10.0.2
ujson 4.0.2 bezobslužné upgrady 0,1 urllib3 1.26.7
virtualenv 20.8.0 vize 0.7.4 wasabi 0.10.1
wcwidth 0.2.5 webencodings 0.5.1 websocket-client 1.3.1
Werkzeug 2.0.2 kolo 0.37.0 widgetsnbextension 3.6.0
wrapt 1.12.1 xgboost 1.5.2 zipp 3.6.0

Knihovny Pythonu v clusterech GPU

Knihovna Verze Knihovna Verze Knihovna Verze
absl-py 1.0.0 Antergos Linux 2015.10 (ISO-Rolling) argon2-cffi 20.1.0
Astor 0.8.1 astunparse 1.6.3 async-generator 1,10
attrs 21.2.0 Azure-Core 1.22.1 azure-cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.1.1 šifra 3.2.2
černý 22.3.0 bělit 4.0.0 blis 0.7.8
boto3 1.21.18 botocore 1.24.18 cachetools 5.2.0
katalog 2.0.8 certifi 2021.10.8 cffi 1.14.6
chardet 4.0.0 charset-normalizer 2.0.4 kliknutí 8.0.3
cloudpickle 2.0.0 cmdstanpy 0.9.68 configparser 5.2.0
convertdate 2.4.0 kryptografie 3.4.8 cyklista 0.10.0
cymem 2.0.6 Cython 0.29.24 databricks-automl-runtime 0.2.10
Databricks-cli 0.17.0 dbl-tempo 0.1.12 dbus-python 1.2.16
ladění 1.4.1 dekoratér 5.1.0 defusedxml 0.7.1
kopr 0.3.4 diskcache 5.4.0 distlib 0.3.5
informace o distribuci 0.23ubuntu1 vstupní body 0.3 ephem 4.1.3
přehled omezujících vlastností 1.0.0 fasttext 0.9.2 filelock 3.3.1
Flask 1.1.2 flatbuffers 1.12 fsspec 2021.8.1
budoucnost 0.18.2 Gast 0.4.0 gitdb 4.0.9
GitPython 3.1.27 google-auth 2.6.0 google-auth-oauthlib 0.4.6
google-pasta 0.2.0 grpcio 1.44.0 gunicorn 20.1.0
gviz-api 1.10.0 h5py 3.3.0 hijri-converter 2.2.4
prázdniny 0.14.2 horovod 0.25.0 htmlmin 0.1.12
huggingface-hub 0.8.1 idna 3.2 ImageHash 4.2.1
nevyvážené učení 0.8.1 importlib-metadata 4.8.1 ipykernel 6.12.1
ipython 7.32.0 ipython-genutils 0.2.0 ipywidgets 7.7.0
isodate 0.6.1 jehodangerous 2.0.1 Jedi 0.18.0
Jinja2 2.11.3 jmespath 0.10.0 joblib 1.0.1
joblibspark 0.5.0 jsonschema 3.2.0 jupyter-client 6.1.12
jupyter-core 4.8.1 jupyterlab-pygments 0.1.2 jupyterlab-widgety 1.0.0
keras 2.9.0 Předběžné zpracování Kerasu 1.1.2 verizonsolver 1.3.1
korejský lunární kalendář 0.2.1 langcodes 3.3.0 libclang 14.0.6
lightgbm 3.3.2 llvmlite 0.37.0 LunárníCalendar 0.0.9
Druh žraloka 1.2.0 Markdown 3.3.6 MarkupSafe 2.0.1
matplotlib 3.4.3 matplotlib-inline 0.1.2 missingno 0.5.1
špatně zamyšlení 0.8.4 mleap 0.20.0 mlflow-hubená 1.28.0
multimethod 1.8 murmurhash 1.0.8 mypy-extensions 0.4.3
nbclient 0.5.3 nbconvert 6.1.0 nbformat 5.1.3
nest-asyncio 1.5.1 networkx 2.6.3 nltk 3.6.5
poznámkový blok 6.4.5 numba 0.54.1 numpy 1.20.3
oauthlib 3.2.0 opt-einsum 3.3.0 balení 21.0
pandas 1.3.4 profilace pandas 3.1.0 pandocfilters 1.4.3
paramiko 2.9.2 parso 0.8.2 pathspec 0.9.0
pathy 0.6.2 bábovka 0.5.2 petastorm 0.11.4
pexpect 4.8.0 Phik 0.12.2 pickleshare 0.7.5
Polštář 8.4.0 jádro 21.2.4 platformdirs 2.5.2
plotly 5.9.0 pmdarima 1.8.5 předběžně připravený 3.0.7
prompt-toolkit 3.0.20 prorok 1.0.1 protobuf 3.19.4
psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
pyarrow 7.0.0 pyasn1 0.4.8 pyasn1-modules 0.2.8
pybind11 2.10.0 pycparser 2,20 pydantic 1.9.2
Pygments 2.10.0 PyGObject 3.36.0 PyJWT 2.4.0
PyMeeus 0.5.11 PyNaCl 1.5.0 pyodbc 4.0.31
pyparsing 3.0.4 pyrsistent 0.18.0 pystan 2.19.1.1
python-apt 2.0.0+ubuntu0.20.4.7 python-dateutil 2.8.2 python-editor 1.0.4
pytz 2021.3 PyWavelets 1.1.1 PyYAML 6.0
pyzmq 22.2.1 regex 2021.8.3 žádosti 2.26.0
requests-oauthlib 1.3.1 requests-unixsocket 0.2.0 rsa 4,9
s3transfer 0.5.2 scikit-learn 0.24.2 scipy 1.7.1
seaborn 0.11.2 Send2Trash 1.8.0 setuptools 58.0.4
setuptools-git 1.2 Shap 0.41.0 simplejson 3.17.6
Šest 1.16.0 kráječ 0.0.7 inteligentní otevření 5.2.1
smmap 5.0.0 spacy 3.4.0 spacy-legacy 3.0.9
spacy-loggers 1.0.3 spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2
srsly 2.4.4 ssh-import-id 5.10 statsmodels 0.12.2
sestavit v tabulku 0.8.9 tangled-up-in-unicode 0.1.0 houževnatost 8.0.1
tensorboard 2.9.1 tensorboard-data-server 0.6.1 tensorboard-plugin-profile 2.8.0
tensorboard-plugin-wit 1.8.1 tensorflow 2.9.1 tensorflow-estimator 2.9.0
tensorflow-io-gcs-filesystem 0.26.0 termcolor 1.1.0 terminado 0.9.4
testpath 0.5.0 tenká 8.1.0 threadpoolctl 2.2.0
tokenize-rt 4.2.1 tokenizátory 0.12.1 tomli 2.0.1
pochodeň 1.11.0+cu113 torchvision 0.12.0+cu113 tornádo 6.1
tqdm 4.62.3 vlastnosti 5.1.0 Transformátory 4.20.1
Typer 0.4.2 typing-extensions 3.10.0.2 ujson 4.0.2
bezobslužné upgrady 0,1 urllib3 1.26.7 virtualenv 20.8.0
vize 0.7.4 wasabi 0.10.1 wcwidth 0.2.5
webencodings 0.5.1 websocket-client 1.3.1 Werkzeug 2.0.2
kolo 0.37.0 widgetsnbextension 3.6.0 wrapt 1.12.1
xgboost 1.5.2 zipp 3.6.0

Knihovny jazyka R

Knihovny jazyka R jsou stejné jako knihovny R v Databricks Runtime 11.2.

Knihovny Java a Scala (cluster Scala 2.12)

Kromě knihoven Java a Scala v Databricks Runtime 11.2 obsahuje Databricks Runtime 11.2 ML následující jary:

Clustery procesoru

ID skupiny ID artefaktu Verze
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.5.2
ml.dmlc xgboost4j_2.12 1.5.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.28.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

Clustery GPU

ID skupiny ID artefaktu Verze
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-gpu_2.12 1.5.2
ml.dmlc xgboost4j-spark-gpu_2.12 1.5.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.28.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0