共用方式為


2018 年 5 月

分階段發行。 您的 Azure Databricks 帳戶可能要到初始發行日期後一週才會更新。

一般資料保護規定 (GDPR)

2018 年 5 月 24 日:2.72 版

為符合於 2018 年 5 月 25 日生效的歐盟一般資料保護規定 (GDPR) 的需求,我們已對 Azure Databricks 平台進行了多項修改,讓您可以在帳號和使用者層級對資料保留提供更多控制權。 更新包括:

  • 叢集刪除:使用 UI 或叢集 API 永久刪除叢集設定。 請參閱刪除計算
  • 工作區清除 (於 2.71 版發行):永久刪除工作區物件,例如整個筆記本、個別筆記本儲存格、個別筆記本註解和筆記本修訂歷史。 請參閱清除工作區儲存體
  • 筆記本修訂歷程記錄清除:
    • 永久刪除工作區中所有筆記本在定義時間範圍內的修訂歷程記錄。 請參閱清除工作區儲存體
    • 永久刪除筆記本的單一修訂或整個修訂歷程記錄。 請參閱版本歷程記錄

如需有關刪除 Azure Databricks 服務或取消 Azure 帳戶的資訊,請參閱管理您的訂用帳戶

Azure Databricks 使用者必須屬於 Microsoft Entra ID 租用戶

2018 年 5 月 24 日:2.72 版

使用者現在只有屬於 Azure Databricks 工作區的 Microsoft Entra ID (前身為 Azure Active Directory) 租用戶,才能登入 Azure Databricks。 如果您有不屬於 Microsoft Entra ID 租用戶的使用者,您可以將他們新增為標準或訪客使用者

HorovodEstimator

2018 年 5 月 29 日:2.72 版

新增 HorovodEstimator 的說明文件和筆記本,HorovodEstimator 是利用 Uber 的 Horovod 架構的 MLlib 型估算器 API。 HorovodEstimator 有助於在 Spark DataFrames 上對深度神經網路進行分散式、多 GPU 訓練,簡化 Spark 中 ETL 與 TensorFlow 中模型訓練的整合。

MLeap ML 模型匯出

2018 年 5 月 24 日:2.72 版

新增在 Azure Databricks 上使用 MLeap 的說明文件和筆記本。 MLeap 可讓您將 Apache Spark 和 scikit-learn 的機器學習管道部署為可移植格式和執行引擎。 請參閱 MLeap ML 模型匯出

更多 GPU 叢集類型

2018 年 5 月 24 日:2.72 版

除了在 2.71 版中新增的 Azure NC 執行個體類型 (NC12 和 NC24) 之外,我們現在還支援 Azure Databricks 叢集上的 NCv3 執行個體類型系列 (NC6s_v3NC12s_v3NC24s_v3)。 NC 和 NCv3 執行個體提供 GPU,為影像處理、文字分析以及其他機器學習和深度學習任務提供效能,這些工作在計算上具有挑戰性,並要求優異的效能。

請參閱已啟用 GPU 的計算

筆記本儲存格:隱藏和顯示

2018 年 5 月 24 日:2.72 版

新的標記和訊息讓您更容易在隱藏筆記本儲存格後顯示其內容。 請參閱隱藏和顯示儲存格內容

2018 年 5 月 22 日

我們已將文件網站搜尋取代為更好的搜尋工具。 在接下來的幾週內,您會看到更多搜尋改善。

注意

如果您在新搜尋部署後不久就嘗試搜尋,搜尋可能會看起來有問題。 只要清除瀏覽器快取,即可看到全新的搜尋體驗。

適用於機器學習的 Databricks Runtime 4.1 ML (測試版)

2018 年 5 月 17 日

Databricks Runtime ML (測試版) 為機器學習和資料科學提供完備環境。 它包含多種熱門的函式庫,包括 TensorFlow、Keras 和 XGBoost。

Databricks Runtime ML 可讓您啟動 Databricks 叢集,其中包含分散式 TensorFlow 訓練所需的所有函式庫。 它可確保叢集上包含的函式庫的相容性 (例如 TensorFlow 與 CUDA/cuDNN 之間的相容性),與使用 Init 指令相比,可大幅減少叢集的啟動時間。

注意

Databricks Runtime 4.1 ML 僅在 Premium SKU 中提供。

請參閱 Databricks Runtime 4.1 ML (EoS) 的完整版本資訊。

Databricks Delta

2018 年 5 月 17 日

Databricks Delta 現已提供 Azure Databricks 使用者個人預覽版。 請聯絡您的帳戶管理員,或在 https://databricks.com/product/databricks-delta 註冊。 此版本為預期即將推出的 GA 版本的候選版本。

如需更多資訊,請參閱 Databricks Runtime 4.1 (EoS)什麼是 Delta Lake?

Display() 影像資料類型的支援

2018 年 5 月 17 日

在 Databricks Runtime 4.1 中,display() 現在可將包含影像資料類型的欄位渲染為豐富的 HTML。

請參閱 Databricks 筆記本中的視覺效果

GPU 叢集類型

2018 年 5 月 15 日:2.71 版

我們很高興宣布在 Azure Databricks 叢集上支援 Azure NC 執行個體類型 (NC12 和 NC24)。 NC 執行個體提供 GPU 來支援影像處理、文字分析,以及其他具計算挑戰性且需要優異效能的機器學習與深度學習任務。

Azure Databricks 也提供預先安裝的 NVIDIA 驅動程式和專為 GPU 設定的函式庫,以及幾個熱門深度學習函式庫的入門資料。

另請參閱:

機密管理 GA

2018 年 5 月 15 日:2.71 版

機密管理,曾在個人預覽版,現在是 GA。 它提供功能強大的工具,讓您管理驗證外部資料來源所需的認證。 與其直接在筆記本中輸入認證,不如使用 Databricks 機密管理在筆記本和工作中儲存和參考認證。 若要管理機密,您可以使用機密 CLI (舊版) 存取機密 API

注意

機密管理需要 Databricks Runtime 4.0 或以上版本和 Databricks CLI 0.7.1 或以上版本。

請參閱機密管理

機密 API 端點和 CLI 命令變更

2018 年 5 月 15 日:2.71 版

對機密 API 端點進行了以下變更:

  • 對於所有端點,根路徑從 /secret 改為 /secrets
  • 對於機密端點,/secret/secrets 收合為 /secrets/
  • 方法 write 已變更為 put

Databricks CLI 0.7.1 包含機密命令的更新,以配合這些更新的 API 端點。

請參閱機密 API機密管理

叢集釘選

2018 年 5 月 15 日:2.71 版

您現在可以將叢集釘選到叢集清單。 這可讓您保留已終止超過 30 天的叢集設定。

釘選叢集

此外,叢集頁面現在會顯示 30 天內終止的所有叢集 (從 7 天增加)。

請參閱釘選計算

叢集自動啟動

2018 年 5 月 15 日:2.71 版

在此版本之前,排定在 Terminated 叢集上執行的作業失敗。 對於在 Azure Databricks 2.71 及以上版本中建立的叢集,來自 JDBC/ODBC 介面的命令或指派給現有已終止叢集的作業執行,都會自動重新啟動該叢集。 請參閱 JDBC 連線設定及編輯 Databricks 工作

自動啟動可讓您設定叢集自動終止,而不需要手動介入來重新啟動排程工作的叢集。 此外,您可以透過排程工作,在指定時間重新啟動已終止的叢集,來排程叢集初始化。

系統會強制執行叢集存取控制,也會照常檢查工作擁有者的權限。

工作區清除

2018 年 5 月 15 日:2.71 版

為符合歐盟一般資料保護規定 (GDPR),我們新增了清除工作區物件的功能,例如整個筆記本、個別筆記本儲存格、個別筆記本註解和筆記本修改記錄。 我們將在未來幾週內發行更多支援 GDPR 合規性的功能和文件。

請參閱清除工作區儲存體

Databricks CLI 0.7.1

2018 年 5 月 10 日

Databricks CLI 0.7.1 包含機密命令的更新,以配合更新的 API 端點。

請參閱 Databricks CLI (舊版)機密管理