2019. duben
Tyto funkce a vylepšení platformy Azure Databricks byly vydány v dubnu 2019.
Poznámka:
Verze jsou připraveny. Váš účet Azure Databricks se nemusí aktualizovat až do týdne po počátečním datu vydání.
MLflow v Azure Databricks (obecná dostupnost)
25. dubna 2019
Spravovaný MLflow v Azure Databricks je teď obecně dostupný. MLflow v Azure Databricks nabízí hostované verze MLflow plně integrované s modelem zabezpečení Databricks a interaktivním pracovním prostorem. Viz MLflow pro agenta generativní AI a životní cyklus modelu ML.
Delta Lake v Azure Databricks
24. dubna 2019
Databricks má opensourcový projekt Delta Lake . Delta Lake je vrstva úložiště, která přináší spolehlivost datových jezer založených na HDFS a cloudovém úložišti tím, že poskytuje transakce ACID prostřednictvím optimistického řízení souběžnosti mezi zápisy a izolací snímků pro konzistentní čtení během zápisů. Delta Lake také poskytuje integrovanou správu verzí dat pro snadné vrácení zpět a reprodukci sestav.
Poznámka:
To, co se dříve jmenovalo Databricks Delta Delta, je teď opensourcový projekt Delta Lake a optimalizace dostupné v Azure Databricks. Podívejte se, co je Delta Lake?
MLflow spustí boční panel
9. dubna – 16. dubna 2019: Verze 2.95
Teď můžete zobrazit spuštění MLflow a revize poznámkového bloku, které tyto běhy vytvořily, na bočním panelu vedle poznámkového bloku. Na pravém bočním panelu poznámkového bloku klikněte na Experiment iconikonu Experiment .
Viz Vytvoření experimentu poznámkového bloku.
Získejte automaticky přístup k službě Azure Data Lake Storage Gen1 a Gen2 pomocí Microsoft Entra ID credentials (GA).
9. dubna – 16. dubna 2019: Verze 2.95
S radostí oznamujeme obecnou dostupnost automatického ověřování pro Azure Data Lake Storage Gen1 a Gen2 z clusterů Azure Databricks pomocí stejné identity Microsoft Entra ID, kterou používáte pro přihlášení k Azure Databricks.
Jednoduše povolte cluster pro předávání přihlašovacích údajů Microsoft Entra ID a příkazy, které v daném clusteru spustíte, budou moct číst a zapisovat data v Azure Data Lake Storage Gen1 a Gen2, aniž byste museli nakonfigurovat instanční objekt credentials pro přístup k úložišti.
Další informace najdete v tématu Přístup ke službě Azure Data Lake Storage pomocí předávání přihlašovacích údajů Microsoft Entra ID (starší verze).
Databricks Runtime 5.3 (obecná dostupnost)
3. dubna 2019
Databricks Runtime 5.3 je teď obecně dostupný. Databricks Runtime 5.3 obsahuje nové funkce a upgrady Delta Lake a upgradované knihovny Pythonu, R, Javy a Scala.
Mezi hlavní upgrady patří:
- Obecná dostupnost cestovního času Databricks Delta
- Replikace table MySQL do Delta, Veřejná ukázka
- Optimalizovaná složka DBFS FUSE pro úlohy hlubokého učení
- Vylepšení knihovny s vymezeným poznámkovým blokem
- Nové rady Poradce pro Databricks
Podrobnosti najdete v tématu Databricks Runtime 5.3 (EoS).
Databricks Runtime 5.3 ML (obecná dostupnost)
3. dubna 2019
S Modulem Databricks Runtime 5.3 pro Machine Learning jsme dosáhli naší první ga databricks Runtime ML! Databricks Runtime ML poskytuje připravené prostředí pro strojové učení a datové vědy. Staví na Databricks Runtime a přidává mnoho oblíbených knihoven strojového učení, včetně TensorFlow, PyTorch, Keras a XGBoost. Podporuje také distribuované trénování s využitím Horovodu.
Tato verze je založená na modulu Databricks Runtime 5.3 s dalšími knihovnami, několika různými verzemi knihoven a správou balíčků Conda pro knihovny Pythonu. Mezi hlavní nové funkce od databricks Runtime 5.2 ML Beta patří:
Integrace MLlib s MLflow (Private Preview), která poskytuje automatické protokolování MLflow pro modely vhodné pomocí algoritmů
CrossValidator
ladění PySpark aTrainValidationSplit
.Pokud se chcete zúčastnit verze Preview, obraťte se na tým účtu Databricks.
Upgraduje na knihovny PyArrow, Horovod a TensorboardX.
PyArrow update přidává možnost používat
BinaryType
při provádění převodu založeného na Arrow a zpřístupňuje tuto funkci v rámci UDF knihovny pandas.
Další informace najdete v tématu Databricks Runtime 5.3 ML (EoS). Pokyny k vytvoření clusteru Databricks Runtime ML najdete v tématu AI a strojové učení v Databricks.