2019. června
Tyto funkce a vylepšení platformy Azure Databricks byly vydány v červnu 2019.
Poznámka:
Verze jsou připraveny. Váš účet Azure Databricks se nemusí aktualizovat až do týdne po počátečním datu vydání.
Podpora instance Lsv2 je obecně dostupná
24. června – 26. června 2019: Verze 2.100
Azure Databricks teď poskytuje plnou podporu pro řadu virtuálních počítačů Lsv2 pro úlohy s vysokou propustností a vysokým počtem IOPS.
Integrace softwaru RStudio se už neomezuje na clustery s vysokou souběžností
6. června – 11. června 2019: Verze 2.99
Teď můžete RStudio Server povolit na standardních clusterech v Azure Databricks, kromě clusterů s vysokou souběžností, které už byly podporované. Integrace RStudio Serveru bez ohledu na režim clusteru nadále vyžaduje, abyste zakázali možnost automatického ukončení clusteru. Viz RStudio v Azure Databricks.
MLflow 1.0
3. června 2019
MLflow je opensourcová platforma pro správu celého životního cyklu strojového učení. S MLflow můžou datoví vědci sledovat a sdílet experimenty místně nebo v cloudu, zabalit a sdílet modely napříč architekturami a nasazovat modely prakticky kdekoli.
S radostí oznamujeme vydání MLflow 1.0 dnes. Verze 1.0 nejen označuje vyspělost a stabilitu rozhraní API, ale také přidává řadu často požadovaných funkcí a vylepšení:
- Rozhraní příkazového řádku bylo znovu uspořádané a teď obsahuje vyhrazené příkazy pro artefakty, modely, databázi (sledovací databázi) a server (sledovací server).
- Vyhledávání na sledovacím serveru podporuje zjednodušenou verzi
SQL WHERE
klauzule. Kromě podpory metrik spuštění a parametrů bylo vyhledávání vylepšeno tak, aby podporovalo některé atributy spuštění a značky uživatelů a systémů. - Přidá podporu souřadnic x v rozhraní API pro sledování. Komponenty vizualizace uživatelského rozhraní MLflow teď také podporují vykreslení metrik proti zadaným hodnotám souřadnic x.
runs/log-batch
Přidá koncový bod rozhraní REST API a také metody Pythonu, R a Javy pro protokolování více metrik, parametrů a značek pomocí jednoho požadavku rozhraní API.- Ke sledování se teď ve Windows podporuje klient MLflow 1.0.
- Přidává podporu HDFS jako back-end úložiště artefaktů.
- Přidá příkaz pro sestavení kontejneru Dockeru, jehož výchozí vstupní bod slouží zadanému modelu funkcí Pythonu MLflow na portu 8080 v kontejneru.
- Přidá experimentální příchuť modelu ONNX .
Úplný seznam změn můžete zobrazit v protokolu změn MLflow.
Databricks Runtime 5.4 pro strojové učení
3. června 2019
Databricks Runtime 5.4 ML je postaven na Databricks Runtime 5.4 (EoS). Obsahuje mnoho oblíbených knihoven strojového učení, včetně TensorFlow, PyTorch, Keras a XGBoost a poskytuje distribuované trénování TensorFlow pomocí Horovodu.
Obsahuje následující nové funkce:
- Integrace knihovny MLlib s MLflow (Public Preview)
- Hyperopt s předinstalovanou třídou SparkTrials (Public Preview).
- Výstup HorovodRunneru odeslaný z Horovodu do uzlu ovladače Spark je teď viditelný v buňkách poznámkového bloku.
- Předinstalovaný balíček XGBoost Pythonu
Podrobnosti najdete v tématu Databricks Runtime 5.4 pro ML (EoS).
Databricks Runtime 5.4
3. června 2019
Databricks Runtime 5.4 je teď k dispozici. Databricks Runtime 5.4 zahrnuje Apache Spark 2.4.2, upgradované knihovny Pythonu, R, Javy a Scala a následující nové funkce:
- Delta Lake v Databricks přidává automatickou optimalizaci (Public Preview)
- Použití oblíbeného integrovaného vývojového prostředí (IDE) a serveru poznámkového bloku s Databricks Connect
- Obecně dostupné nástroje knihovny
- Binární zdroj dat souboru
Podrobnosti najdete v tématu Databricks Runtime 5.4 (EoS).