2020 年 2 月
這些功能和 Azure Databricks 平臺改良功能於 2020 年 2 月發行。
注意
分階段發行。 您的 Azure Databricks 帳戶可能要到初始發行日期後至多一週才會更新。
適用於 Genomics 的 Databricks Runtime 6.4 已正式發行
2020 年 2 月 26 日
Databricks Runtime 6.4 for Genomics 建置在 Databricks Runtime 6.4 之上。 它包含許多來自 Databricks Runtime 6.3 for Genomics 的改進和升級。
主要功能包括:
- 您現在可以自定義 DNASeq Pipeline 使用者可以選擇性地停用讀取對齊、變異呼叫和變體批注階段的任何合法組合。 使用者也可以執行單一端讀取對齊。
- 適用於 Genomics 的 Databricks Runtime 6.4 中所含的 Glow 版本現在僅針對先前透過 SQL 運算式公開的函式提供 Python 和 Scala API。 這些函式適用於 DataFrame 作業,提供改良的編譯時間安全性。
Databricks Runtime 6.4 ML 已正式發行
2020 年 2 月 26 日
Databricks Runtime 6.4 ML GA 帶來連結庫升級,包括:
- PyTorch:1.3.1 至 1.4.0
- Horovod:0.18.2 至 1.19.0
如需詳細資訊,請參閱完整的 適用於ML的 Databricks Runtime 6.4 版本資訊。
Databricks Runtime 6.4 已正式發行
2020 年 2 月 26 日
Databricks Runtime 6.4 GA 帶來新功能、改善和許多錯誤修正。
- 使用自動載入器累加處理新的資料檔(公開預覽)。 自動載入器可讓您在 ETL 期間抵達雲端 Blob 存放區時,以更有效率的方式以累加方式處理新的資料檔。 這是檔案型結構化串流的改善,可重複列出雲端目錄並追蹤已看見的檔案,而且在目錄成長時可能非常沒有效率。
- 使用等冪重試將數據載入 Delta Lake(公開預覽)。
COPY INTO
SQL 命令可讓您使用等冪重試次數將數據載入 Delta Lake 中(公開預覽)。 若要將數據載入 Delta Lake,您必須使用 Apache Spark DataFrame API。 如果在載入期間發生失敗,您必須有效地處理它們。 - Delta 資料表上所有寫入、更新和刪除的作業計量現在會顯示在數據表歷程記錄中。
- Azure Databricks 筆記本中預設會啟用內嵌 Matplotlib 數據(公開預覽)。
如需詳細資訊,請參閱完整的 Databricks Runtime 6.4 (EoS) 版本資訊。
新的互動式圖表提供豐富的用戶端互動
2月25日 - 2019年3月3日:版本3.14
此版本引進了兩個新的互動式圖表類型,可取代條形圖和折線圖實作。 除了現有的圖表功能之外,折線圖還有一些新的自定義繪圖選項:設定 Y 軸範圍、顯示或隱藏標記,以及將記錄尺規套用至 Y 軸。 這兩個圖表都有內建工具列,可支援一組豐富的客戶端互動。
如果您想要使用現有的圖表實作,您可以從 [ 舊版圖表 ] 下拉功能表中選取它們。 現有的圖表將繼續使用先前可用的實作。
新的資料擷取網路新增與 Delta Lake 的合作夥伴整合 (公開預覽)
2020 年 2 月 24 日
現在,您可以輕鬆地填入「Lakehouse」—數據湖,由您通常會使用數據倉儲取得的數據結構和數據管理功能,從數百個數據源轉換成 Delta Lake。 此網路的核心是新的合作夥伴整合資源庫,可從您的工作區存取,並透過我們的合作夥伴 Fivetran、Qlik、Infoworks、StreamSets 和 Syncsort 存取龐大的數據源網路。
如需概觀,請參閱我們的 部落格。 如需詳細資訊,請參閱 技術合作夥伴。
工作區建立者會自動新增為 Azure Databricks 管理員
2020 年 2 月 24 日
在 2020 年 2 月 24 日之前,如果建立 Azure Databricks 工作區的使用者也按兩下 Azure 入口網站中的 [啟動工作區] 按鈕,或已是工作區中已是系統管理員使用者的使用者新增,則只會將建立為工作區的系統管理員使用者(按兩下 [啟動工作區] 按鈕之訂用帳戶的任何 Azure 參與者都會在工作區中建立為系統管理員使用者)。 現在,建立工作區的使用者將會自動新增為工作區管理員。
如需建立和啟動工作區的詳細資訊,請參閱 管理您的訂用帳戶
管理工作區安全性和筆記本功能的旗標現已推出
2020 年 2 月 4-11 日:版本 3.12
此版本引進新的旗標,用於管理傳送的安全性標頭,以防止您工作區的攻擊,以及存取筆記本結果下載和 Git 版本控制。 默認會啟用所有這些系統管理選項。