Sdílet prostřednictvím


Databricks Runtime 12.0 pro Machine Learning (EoS)

Poznámka:

Podpora této verze Databricks Runtime skončila. Datum ukončení podpory najdete v tématu Historie ukončení podpory. Všechny podporované verze databricks Runtime najdete v poznámkách k verzi Databricks Runtime a kompatibilitu.

Databricks Runtime 12.0 pro Machine Learning poskytuje připravené prostředí pro strojové učení a datové vědy založené na databricks Runtime 12.0 (EoS). Databricks Runtime ML obsahuje mnoho oblíbených knihoven strojového učení, včetně TensorFlow, PyTorch a XGBoost. Databricks Runtime ML zahrnuje AutoML, nástroj pro automatické trénování kanálů strojového učení. Databricks Runtime ML také podporuje distribuované trénování hlubokého učení pomocí Horovodu.

Další informace, včetně pokynů k vytvoření clusteru Databricks Runtime ML, najdete v tématu AI a strojové učení v Databricks.

Nové funkce a vylepšení

Databricks Runtime 12.0 ML je postaven na Databricks Runtime 12.0. Informace o novinkách v Databricks Runtime 12.0, včetně Apache Spark MLlib a SparkR, najdete ve zprávě k vydání verze Databricks Runtime 12.0 (EoS).

Vylepšení autoML

  • Modely prognózování teď můžou volitelně zahrnovat státní svátky.
  • Prognózování teď podporuje měsíční, čtvrtletní a roční četnosti.
  • AutoML teď může k trénování používat větší datové sady. AutoML automaticky přiděluje více jader procesoru pro velké datové sady.

Další informace o AutoML naleznete v tématu Co je AutoML?.

MLflow 2.0

Databricks Runtime 12.0 ML zahrnuje MLflow 2.0. MLflow 2.0 vychází ze silné platformy MLflow a zahrnuje rozsáhlou zpětnou vazbu uživatelů, která zjednodušuje pracovní postupy datových věd a poskytuje inovativní prvotřídní nástroje pro MLOps. Mezi funkce a vylepšení patří rozšíření MLflow Recipes (dříve MLflow Pipelines), jako je AutoML, ladění hyperparametrů a podpora klasifikace, stejně jako modernizované integrace s ekosystémem ML, zjednodušené uživatelské rozhraní pro sledování MLflow, aktualizace základních rozhraní API napříč komponentami platformy MLflow a další. Další informace najdete v dokumentaci k MLflow 2.0 nebo se podívejte na blogový příspěvek.

scikit-learn 1.0

Databricks Runtime ML 12.0 obsahuje scikit-learn verzi 1.0. scikit-learn Informace o změnách v této verzi scikit-learn najdete v dokumentaci.

Prostředí systému

Systémové prostředí v Databricks Runtime 12.0 ML se liší od Databricks Runtime 12.0 následujícím způsobem:

Databricks Runtime 12.0 ML zahrnuje XGBoost 1.6.2, který nepodporuje clustery GPU s výpočetní schopností 5.2 a nižší.

Knihovny

Následující části obsahují seznam knihoven zahrnutých v Databricks Runtime 12.0 ML, které se liší od knihoven zahrnutých v Databricks Runtime 12.0.

V této části:

Knihovny nejvyšší úrovně

Databricks Runtime 12.0 ML obsahuje následující knihovny nejvyšší úrovně:

Knihovny Pythonu

Databricks Runtime 12.0 ML používá Virtualenv pro správu balíčků Pythonu a obsahuje mnoho oblíbených balíčků ML.

Kromě balíčků uvedených v následujících částech obsahuje Databricks Runtime 12.0 ML také následující balíčky:

  • hyperopt 0.2.7.db1
  • sparkdl 2.3.0-db3
  • automl 1.14.1

Pokud chcete reprodukovat prostředí Databricks Runtime ML Python v místním virtuálním prostředí Pythonu, stáhněte si soubor requirements-12.0.txt a spusťte pip install -r requirements-12.0.txt. Tento příkaz nainstaluje všechny opensourcové knihovny, které databricks Runtime ML používá, ale neinstaluje knihovny vyvinuté službou Databricks, například databricks-automl, databricks-feature-storenebo fork Databricks fork hyperopt.

Knihovny Pythonu v clusterech procesorů

Knihovna Verze Knihovna Verze Knihovna Verze
absl-py 1.0.0 argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0
Astor 0.8.1 asttokens 2.0.5 astunparse 1.6.3
attrs 21.4.0 Azure-Core 1.26.1 azure-cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.2.0 šifra 3.2.0
krásnásoup4 4.11.1 černý 22.3.0 bělit 4.1.0
blis 0.7.9 boto3 1.21.32 botocore 1.24.32
cachetools 4.2.2 katalog 2.0.8 kodéry kategorií 2.5.1.post0
certifi 2021.10.8 cffi 1.15.0 chardet 4.0.0
charset-normalizer 2.0.4 kliknutí 8.0.4 cloudpickle 2.0.0
cmdstanpy 1.0.8 cukroví 0.0.3 configparser 5.2.0
convertdate 2.4.0 kryptografie 3.4.8 cyklista 0.11.0
cymem 2.0.7 Cython 0.29.28 databricks-automl-runtime 0.2.13
Databricks-cli 0.17.3 Úložiště funkcí databricks 0.8.0 dbl-tempo 0.1.12
dbus-python 1.2.16 ladění 1.5.1 dekoratér 5.1.1
defusedxml 0.7.1 kopr 0.3.4 diskcache 5.4.0
distlib 0.3.6 vstupní body 0,4 ephem 4.1.3
vykonávající 0.8.3 přehled omezujících vlastností 1.0.0 fastjsonschema 2.16.2
fasttext 0.9.2 filelock 3.6.0 Flask 1.1.2
flatbuffers 22.10.26 fonttools 4.25.0 fsspec 2022.2.0
budoucnost 0.18.2 Gast 0.4.0 gitdb 4.0.9
GitPython 3.1.27 google-auth 1.33.0 google-auth-oauthlib 0.4.6
google-pasta 0.2.0 grpcio 1.42.0 gunicorn 20.1.0
gviz-api 1.10.0 h5py 3.6.0 hijri-converter 2.2.4
prázdniny 0,16 horovod 0.25.0 htmlmin 0.1.12
huggingface-hub 0.11.0 idna 3.3 ImageHash 4.3.1
nevyvážené učení 0.8.1 importlib-metadata 4.11.3 ipykernel 6.15.3
ipython 8.5.0 ipython-genutils 0.2.0 ipywidgets 7.7.2
isodate 0.6.1 jehodangerous 2.0.1 Jedi 0.18.1
Jinja2 2.11.3 jmespath 0.10.0 joblib 1.1.0
joblibspark 0.5.0 jsonschema 4.4.0 jupyter-client 6.1.12
jupyter_core 4.11.2 jupyterlab-pygments 0.1.2 jupyterlab-widgety 1.0.0
keras 2.10.0 Předběžné zpracování Kerasu 1.1.2 verizonsolver 1.3.2
korejský lunární kalendář 0.3.1 langcodes 3.3.0 libclang 14.0.6
lightgbm 3.3.3 llvmlite 0.38.0 LunárníCalendar 0.0.9
Druh žraloka 1.2.0 Markdown 3.3.4 MarkupSafe 2.0.1
matplotlib 3.5.1 matplotlib-inline 0.1.2 missingno 0.5.1
špatně zamyšlení 0.8.4 mleap 0.20.0 mlflow-hubená 2.0.1
multimethod 1.8 murmurhash 1.0.9 mypy-extensions 0.4.3
nbclient 0.5.13 nbconvert 6.4.4 nbformat 5.3.0
nest-asyncio 1.5.5 networkx 2.7.1 nltk 3.7
poznámkový blok 6.4.8 numba 0.55.1 numpy 1.21.5
oauthlib 3.2.0 opt-einsum 3.3.0 balení 21.3
pandas 1.4.2 profilace pandas 3.3.0 pandocfilters 1.5.0
paramiko 2.9.2 parso 0.8.3 pathspec 0.9.0
pathy 0.6.1 bábovka 0.5.2 petastorm 0.11.4
pexpect 4.8.0 Phik 0.12.2 pickleshare 0.7.5
Polštář 9.0.1 jádro 21.2.4 platformdirs 2.5.4
plotly 5.6.0 pmdarima 2.0.1 předběžně připravený 3.0.8
prometheus-client 0.13.1 prompt-toolkit 3.0.20 prorok 1.1.1
protobuf 3.19.4 psutil 5.8.0 psycopg2 2.9.3
ptyprocess 0.7.0 čistý-eval 0.2.2 pyarrow 7.0.0
pyasn1 0.4.8 pyasn1-modules 0.2.8 pybind11 2.10.1
pycparser 2.21 pydantic 1.9.2 Pygments 2.11.2
PyGObject 3.36.0 PyJWT 2.6.0 PyMeeus 0.5.11
PyNaCl 1.5.0 pyodbc 4.0.32 pyparsing 3.0.4
pyrsistent 0.18.0 python-dateutil 2.8.2 python-editor 1.0.4
pytz 2021.3 PyWavelets 1.3.0 PyYAML 6.0
pyzmq 22.3.0 regex 2022.3.15 žádosti 2.27.1
requests-oauthlib 1.3.1 requests-unixsocket 0.2.0 rsa 4.7.2
s3transfer 0.5.0 scikit-learn 1.0.2 scipy 1.7.3
seaborn 0.11.2 Send2Trash 1.8.0 setuptools 61.2.0
setuptools-git 1.2 Shap 0.41.0 simplejson 3.17.6
Šest 1.16.0 kráječ 0.0.7 inteligentní otevření 5.1.0
smmap 5.0.0 polévky 2.3.1 spacy 3.4.1
spacy-legacy 3.0.10 spacy-loggers 1.0.3 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.2 srsly 2.4.5 ssh-import-id 5.10
stack-data 0.2.0 statsmodels 0.13.2 sestavit v tabulku 0.8.9
tangled-up-in-unicode 0.2.0 houževnatost 8.0.1 tensorboard 2.10.0
tensorboard-data-server 0.6.1 tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1
tensorflow-cpu 2.10.0 tensorflow-estimator 2.10.0 tensorflow-io-gcs-filesystem 0.28.0
termcolor 2.1.1 terminado 0.13.1 testpath 0.5.0
tenká 8.1.5 threadpoolctl 2.2.0 tokenize-rt 4.2.1
tokenizátory 0.13.2 tomli 1.2.2 pochodeň 1.12.1+cpu
torchvision 0.13.1+cpu tornádo 6.1 tqdm 4.64.0
vlastnosti 5.1.1 Transformátory 4.23.1 Typer 0.4.2
typing_extensions 4.1.1 bezobslužné upgrady 0,1 urllib3 1.26.9
virtualenv 20.8.0 vize 0.7.5 wasabi 0.10.1
wcwidth 0.2.5 webencodings 0.5.1 websocket-client 0.58.0
Werkzeug 2.0.3 kolo 0.37.1 widgetsnbextension 3.6.1
wrapt 1.12.1 zipp 3.7.0

Knihovny Pythonu v clusterech GPU

Knihovna Verze Knihovna Verze Knihovna Verze
absl-py 1.0.0 argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0
Astor 0.8.1 asttokens 2.0.5 astunparse 1.6.3
attrs 21.4.0 Azure-Core 1.26.1 azure-cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.2.0 šifra 3.2.0
krásnásoup4 4.11.1 černý 22.3.0 bělit 4.1.0
blis 0.7.9 boto3 1.21.32 botocore 1.24.32
cachetools 4.2.2 katalog 2.0.8 kodéry kategorií 2.5.1.post0
certifi 2021.10.8 cffi 1.15.0 chardet 4.0.0
charset-normalizer 2.0.4 kliknutí 8.0.4 cloudpickle 2.0.0
cmdstanpy 1.0.8 cukroví 0.0.3 configparser 5.2.0
convertdate 2.4.0 kryptografie 3.4.8 cyklista 0.11.0
cymem 2.0.7 Cython 0.29.28 databricks-automl-runtime 0.2.13
Databricks-cli 0.17.3 Úložiště funkcí databricks 0.8.0 dbl-tempo 0.1.12
dbus-python 1.2.16 ladění 1.5.1 dekoratér 5.1.1
defusedxml 0.7.1 kopr 0.3.4 diskcache 5.4.0
distlib 0.3.6 vstupní body 0,4 ephem 4.1.3
vykonávající 0.8.3 přehled omezujících vlastností 1.0.0 fastjsonschema 2.16.2
fasttext 0.9.2 filelock 3.6.0 Flask 1.1.2
flatbuffers 22.10.26 fonttools 4.25.0 fsspec 2022.2.0
budoucnost 0.18.2 Gast 0.4.0 gitdb 4.0.9
GitPython 3.1.27 google-auth 1.33.0 google-auth-oauthlib 0.4.6
google-pasta 0.2.0 grpcio 1.42.0 gunicorn 20.1.0
gviz-api 1.10.0 h5py 3.6.0 hijri-converter 2.2.4
prázdniny 0,16 horovod 0.25.0 htmlmin 0.1.12
huggingface-hub 0.11.0 idna 3.3 ImageHash 4.3.1
nevyvážené učení 0.8.1 importlib-metadata 4.11.3 ipykernel 6.15.3
ipython 8.5.0 ipython-genutils 0.2.0 ipywidgets 7.7.2
isodate 0.6.1 jehodangerous 2.0.1 Jedi 0.18.1
Jinja2 2.11.3 jmespath 0.10.0 joblib 1.1.0
joblibspark 0.5.0 jsonschema 4.4.0 jupyter-client 6.1.12
jupyter_core 4.11.2 jupyterlab-pygments 0.1.2 jupyterlab-widgety 1.0.0
keras 2.10.0 Předběžné zpracování Kerasu 1.1.2 verizonsolver 1.3.2
korejský lunární kalendář 0.3.1 langcodes 3.3.0 libclang 14.0.6
lightgbm 3.3.3 llvmlite 0.38.0 LunárníCalendar 0.0.9
Druh žraloka 1.2.0 Markdown 3.3.4 MarkupSafe 2.0.1
matplotlib 3.5.1 matplotlib-inline 0.1.2 missingno 0.5.1
špatně zamyšlení 0.8.4 mleap 0.20.0 mlflow-hubená 2.0.1
multimethod 1.8 murmurhash 1.0.9 mypy-extensions 0.4.3
nbclient 0.5.13 nbconvert 6.4.4 nbformat 5.3.0
nest-asyncio 1.5.5 networkx 2.7.1 nltk 3.7
poznámkový blok 6.4.8 numba 0.55.1 numpy 1.21.5
oauthlib 3.2.0 opt-einsum 3.3.0 balení 21.3
pandas 1.4.2 profilace pandas 3.3.0 pandocfilters 1.5.0
paramiko 2.9.2 parso 0.8.3 pathspec 0.9.0
pathy 0.6.1 bábovka 0.5.2 petastorm 0.11.4
pexpect 4.8.0 Phik 0.12.2 pickleshare 0.7.5
Polštář 9.0.1 jádro 21.2.4 platformdirs 2.5.4
plotly 5.6.0 pmdarima 2.0.1 předběžně připravený 3.0.8
prompt-toolkit 3.0.20 prorok 1.1.1 protobuf 3.19.4
psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
čistý-eval 0.2.2 pyarrow 7.0.0 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.10.1 pycparser 2.21
pydantic 1.9.2 Pygments 2.11.2 PyGObject 3.36.0
PyJWT 2.6.0 PyMeeus 0.5.11 PyNaCl 1.5.0
pyodbc 4.0.32 pyparsing 3.0.4 pyrsistent 0.18.0
python-dateutil 2.8.2 python-editor 1.0.4 pytz 2021.3
PyWavelets 1.3.0 PyYAML 6.0 pyzmq 22.3.0
regex 2022.3.15 žádosti 2.27.1 requests-oauthlib 1.3.1
requests-unixsocket 0.2.0 rsa 4.7.2 s3transfer 0.5.0
scikit-learn 1.0.2 scipy 1.7.3 seaborn 0.11.2
Send2Trash 1.8.0 setuptools 61.2.0 setuptools-git 1.2
Shap 0.41.0 simplejson 3.17.6 Šest 1.16.0
kráječ 0.0.7 inteligentní otevření 5.1.0 smmap 5.0.0
polévky 2.3.1 spacy 3.4.1 spacy-legacy 3.0.10
spacy-loggers 1.0.3 spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2
srsly 2.4.5 ssh-import-id 5.10 stack-data 0.2.0
statsmodels 0.13.2 sestavit v tabulku 0.8.9 tangled-up-in-unicode 0.2.0
houževnatost 8.0.1 tensorboard 2.10.0 tensorboard-data-server 0.6.1
tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1 tensorflow 2.10.0
tensorflow-estimator 2.10.0 tensorflow-io-gcs-filesystem 0.28.0 termcolor 2.1.1
terminado 0.13.1 testpath 0.5.0 tenká 8.1.5
threadpoolctl 2.2.0 tokenize-rt 4.2.1 tokenizátory 0.13.2
tomli 1.2.2 pochodeň 1.12.1+cu113 torchvision 0.13.1+cu113
tornádo 6.1 tqdm 4.64.0 vlastnosti 5.1.1
Transformátory 4.23.1 Typer 0.4.2 typing_extensions 4.1.1
bezobslužné upgrady 0,1 urllib3 1.26.9 virtualenv 20.8.0
vize 0.7.5 wasabi 0.10.1 wcwidth 0.2.5
webencodings 0.5.1 websocket-client 0.58.0 Werkzeug 2.0.3
kolo 0.37.1 widgetsnbextension 3.6.1 wrapt 1.12.1
zipp 3.7.0

Knihovny jazyka R

Knihovny R jsou identické s knihovnami jazyka R v Databricks Runtime 12.0.

Knihovny Java a Scala (cluster Scala 2.12)

Kromě knihoven Java a Scala v Databricks Runtime 12.0 obsahuje Databricks Runtime 12.0 ML následující jary:

Clustery procesoru

ID skupiny ID artefaktu Verze
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.6.2
ml.dmlc xgboost4j_2.12 1.6.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 2.0.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

Clustery GPU

ID skupiny ID artefaktu Verze
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-gpu_2.12 1.6.2
ml.dmlc xgboost4j-spark-gpu_2.12 1.6.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 2.0.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0