2019 年 2 月
這些功能和 Azure Databricks 平台改善功能於 2019 年 2 月發行。
注意
分階段發行。 您的 Azure Databricks 帳戶可能要到初始發行日期後至多一週才會更新。
Databricks Light 已正式發行
2019 年 2 月 26 日至 3 月 5 日:2.92 版
Databricks Light (也稱為 Data Engineering Light) 現已推出。 Databricks Light 是開放原始碼 Apache Spark 執行階段的 Databricks 套件。 它為不需要 Databricks Runtime 提供的進階效能、可靠性或自動調整優點的工作提供執行階段選項。 只有在建立叢集來執行 JAR、Python 或 spark-submit 作業時,才能 select Databricks Light;您無法針對執行互動式或筆記本作業工作負載的叢集 select 此運行時間。 請參閱 Databricks Light。
Azure Databricks 上的受控 MLflow 公開預覽
2019 年 2 月 26 日至 3 月 5 日:2.92 版
MLflow 是一個開放原始碼平台,可供您管理端對端機器學習生命週期。 它會處理三個主要功能:
- 追蹤實驗以記錄和比較 parameters 和結果。
- 管理模型,並將模型從各種 ML 程式庫部署到各種模型服務和推斷平台。
- 以可重複使用、可重現的形式封裝 ML 程式碼,以與其他資料科學家共用,或傳輸至實際執行環境。
Azure Databricks 現在提供與企業安全性功能、高可用性和其他 Azure Databricks 工作區功能整合的完全受控和託管的 MLflow 版本,例如實驗管理、執行管理和筆記本修訂擷取。 Azure Databricks 上的 MLflow 提供追蹤和保護機器學習模型訓練執行和執行機器學習專案的整合式體驗。 藉由在 Azure Databricks 上使用受控 MLflow,您 get 這兩個平台的優點,包括:
- 工作區:使用託管的 MLflow 追蹤伺服器和整合式實驗 UI,在 Azure Databricks 工作區內共同追蹤及組織實驗和結果。 當您在筆記本中使用 MLflow 時,Azure Databricks 會自動擷取筆記本修訂,以便您可以重現相同的程式碼並在稍後執行。
- 安全性:透過 ACL 利用整個 ML 生命週期的一個常見資訊安全模型。
- 工作:從遠端和直接從 Azure Databricks 筆記本將 MLflow 專案作為 Azure Databricks 工作執行。
以下是 Azure Databricks 工作區中追蹤工作流程的示範:
如需詳細資訊,請參閱 使用 MLflow追蹤模型開發。
Azure Data Lake Storage Gen2 連接器已正式發行
2019 年 2 月 15 日
Azure Data Lake Storage Gen2 (ADLS Gen2) 是適用於巨量資料分析的新一代資料湖解決方案,現已正式發行,適用於 Azure Databricks 的 ADLS Gen2 連接器亦是如此。 我們也很高興地宣告,當您在 Databricks Runtime 5.2 和更新版本上執行叢集時,ADLS Gen2 會支援 Databricks Delta。
現在建立叢集時,Python 3 是預設值
2019 年 2 月 12-19 日:2.91 版
使用 UI 建立的叢集的預設 Python 版本已從 Python 2 切換為 Python 3。 使用 REST API 建立的叢集的預設值仍然是 Python 2。
現有的叢集不會變更其 Python 版本。 但是,如果您習慣在建立新叢集時將 Python 2 作為預設版本,則需要開始注意 Python 版本的選擇。
Delta Lake 正式發行
2019 年 2 月 1 日
現在每個人都可以 get Databricks Delta 強大的交易式儲存層和超快速讀取的優點:從 2 月 1 日起,Delta Lake 是 GA,而且可在所有支援的 Databricks Runtime 版本上使用。 如需 Delta 的相關資訊,請參閱什麼是 Delta Lake?。