2019 年 6 月
這些功能和 Azure Databricks 平臺改良功能於 2019 年 6 月發行。
注意
分階段發行。 您的 Azure Databricks 帳戶可能要到初始發行日期後至多一週才會更新。
Lsv2 執行個體支援已正式發行
2019 年 6 月 24 日 - 26 日:版本 2.100
Azure Databricks 現在為 Lsv2 VM 系列提供高輸送量和高 IOPS 工作負載的完整支援。
RStudio 整合不再僅限高並行叢集
2019 年 6 月 6 日至 11 日:版本 2.99
現在,除了已支援的高並行叢集之外,您還可以在 Azure Databricks 中的標準叢集上啟用 RStudio Server。 不論叢集模式為何,RStudio Server 整合仍會要求您停用叢集的 自動終止 選項。 請參閱 Azure Databricks 上的 RStudio。
MLflow 1.0
2019 年 6 月 3 日
MLflow 是管理完整機器學習生命週期 開放原始碼 平臺。 透過 MLflow,數據科學家可以在本機或雲端或雲端中追蹤和共用實驗,並跨架構封裝和共用模型,並在任何地方部署模型。
我們很高興今天宣布發行 MLflow 1.0。 1.0 版本不僅會標示 API 的成熟度和穩定性,還會新增一些經常要求的功能和改進:
- CLI 已重新組織,現在有成品、模型、db(追蹤資料庫)和伺服器(追蹤伺服器)的專用命令。
- 追蹤伺服器搜尋支持簡化的
SQL WHERE
子句版本。 除了支援執行計量和參數之外,已增強搜尋以支援某些執行屬性和使用者和系統標籤。 - 在追蹤 API 中新增 x 座標的支援。 MLflow UI 視覺效果元件現在也支持針對提供的 x 座標 values繪製計量。
- 新增
runs/log-batch
REST API 端點,以及 Python、R 和 Java 方法,以便透過單一 API 請求記錄多個指標、parameters和標籤。 - 為了追蹤,Windows 現在支援 MLflow 1.0 用戶端。
- 將 HDFS 的支援新增為成品存放區後端。
- 新增命令來建置 Docker 容器,其預設進入點會在容器內的埠 8080 提供指定的 MLflow Python 函式模型。
- 新增實驗 性 ONNX 模型類別。
您可以在 的 MLflow 變更記錄中查看完整的 list 變更。
適用於機器學習的 Databricks Runtime 5.4
2019 年 6 月 3 日
Databricks Runtime 5.4 ML 建置在 Databricks Runtime 5.4 (EoS) 之上。 其中包含許多熱門的機器學習程式庫,包括 TensorFlow、PyTorch、Keras 和 XGBoost,並使用 Horovod 提供分散式 TensorFlow 訓練。
其中包含下列新功能:
- MLlib 與 MLflow 整合 (公開預覽)。
- 已預安裝新 SparkTrials 類別的 Hyperopt (公開預覽)。
- 從 Horovod 傳送至 Spark 驅動程式節點的 HorovodRunner 輸出現在會顯示在筆記本數據格中。
- XGBoost Python 套件預安裝。
如需詳細資訊,請參閱 適用於ML的 Databricks Runtime 5.4 (EoS) 。
Databricks Runtime 5.4
2019 年 6 月 3 日
Databricks Runtime 5.4 現已推出。 Databricks Runtime 5.4 包含 Apache Spark 2.4.2、升級的 Python、R、Java 和 Scala 連結庫,以及下列新功能:
- Databricks 上的 Delta Lake 新增 Auto Optimize (公開預覽版)
- 搭配 Databricks Connect 使用您慣用的 IDE 和筆記本伺服器
- 連結庫公用程式正式推出
- 二進位檔數據源
如需詳細資訊,請參閱 Databricks Runtime 5.4 (EoS)。