2018 年 5 月
分階段發行。 您的 Azure Databricks 帳戶可能要到初始發行日期後一週才會更新。
一般資料保護規定 (GDPR)
2018 年 5 月 24 日:2.72 版
為符合於 2018 年 5 月 25 日生效的歐盟一般資料保護規定 (GDPR) 的需求,我們已對 Azure Databricks 平台進行了多項修改,讓您可以在帳號和使用者層級對資料保留提供更多控制權。 更新包括:
- 叢集刪除:使用 UI 或叢集 API 永久刪除叢集設定。 請參閱刪除計算。
- 工作區清除 (於 2.71 版發行):永久刪除工作區物件,例如整個筆記本、個別筆記本儲存格、個別筆記本註解和筆記本修訂歷史。 請參閱清除工作區儲存體。
- 筆記本修訂歷程記錄清除:
如需有關刪除 Azure Databricks 服務或取消 Azure 帳戶的資訊,請參閱管理您的訂用帳戶。
Azure Databricks 使用者必須屬於 Microsoft Entra ID 租用戶
2018 年 5 月 24 日:2.72 版
使用者現在只有屬於 Azure Databricks 工作區的 Microsoft Entra ID (前身為 Azure Active Directory) 租用戶,才能登入 Azure Databricks。 如果您有不屬於 Microsoft Entra ID 租用戶的使用者,您可以將他們新增為標準或訪客使用者。
HorovodEstimator
2018 年 5 月 29 日:2.72 版
新增 HorovodEstimator 的說明文件和筆記本,HorovodEstimator 是利用 Uber 的 Horovod 架構的 MLlib 型估算器 API。 HorovodEstimator 有助於在 Spark DataFrames 上對深度神經網路進行分散式、多 GPU 訓練,簡化 Spark 中 ETL 與 TensorFlow 中模型訓練的整合。
MLeap ML 模型匯出
2018 年 5 月 24 日:2.72 版
新增在 Azure Databricks 上使用 MLeap 的說明文件和筆記本。 MLeap 可讓您將 Apache Spark 和 scikit-learn 的機器學習管道部署為可移植格式和執行引擎。 請參閱 MLeap ML 模型匯出。
更多 GPU 叢集類型
2018 年 5 月 24 日:2.72 版
除了在 2.71 版中新增的 Azure NC 執行個體類型 (NC12 和 NC24) 之外,我們現在還支援 Azure Databricks 叢集上的 NCv3 執行個體類型系列 (NC6s_v3、NC12s_v3 和 NC24s_v3)。 NC 和 NCv3 執行個體提供 GPU,為影像處理、文字分析以及其他機器學習和深度學習任務提供效能,這些工作在計算上具有挑戰性,並要求優異的效能。
請參閱已啟用 GPU 的計算。
筆記本儲存格:隱藏和顯示
2018 年 5 月 24 日:2.72 版
新的標記和訊息讓您更容易在隱藏筆記本儲存格後顯示其內容。 請參閱隱藏和顯示儲存格內容。
文件網站搜尋
2018 年 5 月 22 日
我們已將文件網站搜尋取代為更好的搜尋工具。 在接下來的幾週內,您會看到更多搜尋改善。
注意
如果您在新搜尋部署後不久就嘗試搜尋,搜尋可能會看起來有問題。 只要清除瀏覽器快取,即可看到全新的搜尋體驗。
適用於機器學習的 Databricks Runtime 4.1 ML (測試版)
2018 年 5 月 17 日
Databricks Runtime ML (測試版) 為機器學習和資料科學提供完備環境。 它包含多種熱門的函式庫,包括 TensorFlow、Keras 和 XGBoost。
Databricks Runtime ML 可讓您啟動 Databricks 叢集,其中包含分散式 TensorFlow 訓練所需的所有函式庫。 它可確保叢集上包含的函式庫的相容性 (例如 TensorFlow 與 CUDA/cuDNN 之間的相容性),與使用 Init 指令相比,可大幅減少叢集的啟動時間。
注意
Databricks Runtime 4.1 ML 僅在 Premium SKU 中提供。
請參閱 Databricks Runtime 4.1 ML (EoS) 的完整版本資訊。
Databricks Delta
2018 年 5 月 17 日
Databricks Delta 現已提供 Azure Databricks 使用者個人預覽版。 請聯絡您的帳戶管理員,或在 https://databricks.com/product/databricks-delta 註冊。 此版本為預期即將推出的 GA 版本的候選版本。
如需更多資訊,請參閱 Databricks Runtime 4.1 (EoS) 和 什麼是 Delta Lake?。
Display() 影像資料類型的支援
2018 年 5 月 17 日
在 Databricks Runtime 4.1 中,display()
現在可將包含影像資料類型的欄位渲染為豐富的 HTML。
請參閱 Databricks 筆記本中的視覺效果。
GPU 叢集類型
2018 年 5 月 15 日:2.71 版
我們很高興宣布在 Azure Databricks 叢集上支援 Azure NC 執行個體類型 (NC12 和 NC24)。 NC 執行個體提供 GPU 來支援影像處理、文字分析,以及其他具計算挑戰性且需要優異效能的機器學習與深度學習任務。
Azure Databricks 也提供預先安裝的 NVIDIA 驅動程式和專為 GPU 設定的函式庫,以及幾個熱門深度學習函式庫的入門資料。
另請參閱:
機密管理 GA
2018 年 5 月 15 日:2.71 版
機密管理,曾在個人預覽版,現在是 GA。 它提供功能強大的工具,讓您管理驗證外部資料來源所需的認證。 與其直接在筆記本中輸入認證,不如使用 Databricks 機密管理在筆記本和工作中儲存和參考認證。 若要管理機密,您可以使用機密 CLI (舊版) 存取機密 API。
注意
機密管理需要 Databricks Runtime 4.0 或以上版本和 Databricks CLI 0.7.1 或以上版本。
請參閱機密管理。
機密 API 端點和 CLI 命令變更
2018 年 5 月 15 日:2.71 版
對機密 API 端點進行了以下變更:
- 對於所有端點,根路徑從
/secret
改為/secrets
。 - 對於機密端點,
/secret/secrets
收合為/secrets/
。 - 方法
write
已變更為put
。
Databricks CLI 0.7.1 包含機密命令的更新,以配合這些更新的 API 端點。
叢集釘選
2018 年 5 月 15 日:2.71 版
您現在可以將叢集釘選到叢集清單。 這可讓您保留已終止超過 30 天的叢集設定。
此外,叢集頁面現在會顯示 30 天內終止的所有叢集 (從 7 天增加)。
請參閱釘選計算。
叢集自動啟動
2018 年 5 月 15 日:2.71 版
在此版本之前,排定在 Terminated
叢集上執行的作業失敗。 對於在 Azure Databricks 2.71 及以上版本中建立的叢集,來自 JDBC/ODBC 介面的命令或指派給現有已終止叢集的作業執行,都會自動重新啟動該叢集。 請參閱 JDBC 連線和設定及編輯 Databricks 工作。
自動啟動可讓您設定叢集自動終止,而不需要手動介入來重新啟動排程工作的叢集。 此外,您可以透過排程工作,在指定時間重新啟動已終止的叢集,來排程叢集初始化。
系統會強制執行叢集存取控制,也會照常檢查工作擁有者的權限。
工作區清除
2018 年 5 月 15 日:2.71 版
為符合歐盟一般資料保護規定 (GDPR),我們新增了清除工作區物件的功能,例如整個筆記本、個別筆記本儲存格、個別筆記本註解和筆記本修改記錄。 我們將在未來幾週內發行更多支援 GDPR 合規性的功能和文件。
請參閱清除工作區儲存體。
Databricks CLI 0.7.1
2018 年 5 月 10 日
Databricks CLI 0.7.1 包含機密命令的更新,以配合更新的 API 端點。
請參閱 Databricks CLI (舊版)和機密管理。