管理筆記本格式
本文介紹 Azure Databricks 中的預設筆記本格式、如何更改筆記本格式,以及如果筆記本位於原始碼控制資料夾中,應如何管理認可。
根據預設,Databricks 中的筆記本會以 .ipynb
(IPython 或 Jupyter) 格式建立。 您也可以選擇改用來源格式。
您仍然可以以各種格式匯入和匯出筆記本。 請參閱 匯出和匯入 Databricks 筆記本。
筆記本格式
Databricks 支援以兩種格式建立和編輯筆記本:IPYNB (預設值) 和來源。
您可以使用 Git 資料夾來管理來源檔案,包括筆記本。 Git 資料夾中僅支援某些 Databricks 資產類型。 筆記本格式會影響哪些輸出會提交至遠端存放庫,如下表所述。
筆記本來源格式 | 詳細資料 |
---|---|
源 | 僅用於擷取原始程式碼的基本格式,後綴用於表示程式語言,例如 .py 、.scala 、.r 和 .sql 。 |
IPYNB (Jupyter) | 豐富的格式,可擷取原始程式碼、筆記本環境、視覺效果定義、筆記本小工具,以及選擇性輸出。 IPYNB 筆記本可以包含任何 Databricks 筆記本所支援語言的程式碼(儘管在 py 部分有 .ipynb )。 IPYNB(Jupyter)格式允許用戶選擇性提交輸出。 IPYNB 也支援遠端 Git 存放庫上 Databricks 筆記本的更佳檢視體驗。 |
為了區分 Databricks 筆記本與一般 Python、Scala 和 SQL 檔案,Azure Databricks 會將批注 “Databricks notebook source
” 新增至 Python、Scala 和 SQL 筆記本的頂端。 此批注可確保 Azure Databricks 正確地將檔案剖析為筆記本,而不是腳本檔案。
注意
什麼是「輸出」?
輸出是在 Databricks 平臺上執行筆記本的結果,包括數據表顯示和視覺效果。
變更預設筆記本格式設定
在 Azure Databricks 上建立新筆記本時,IPYNB 筆記本是預設格式。
若要將預設值變更為 Azure Databricks 來源格式,請登入您的 Azure Databricks 工作區,按一下頁面右上角的個人資料,然後按一下 [設定]
轉換筆記本格式
您可以透過 Azure Databricks UI 將現有的筆記本轉換成另一種格式。
若要將現有的筆記本轉換成另一種格式:
在工作區中開啟筆記本。
從工作區功能表中選取 [檔案],然後選取 [Notebook 格式],然後選擇您想要的格式。 您可以選擇 Jupyter(.ipynb)(建議) 或 Source(.scala、.py、.sql、.r)。 筆記本目前的格式呈現灰色,且旁邊有核取號。
如需 Azure Databricks 所支援筆記本類型的詳細資訊,請參閱 匯出和匯入 Databricks 筆記本。
管理 Jupyter Notebook 的 IPYNB 文件輸出提交
對於受到原始檔控制的資料夾中的 IPYNB 筆記本,您可以管理如何將筆記本的輸出結果提交到遠端存放庫。
允許提交 .ipynb
筆記本輸出
只有在工作區管理員已啟用此功能時,才能提交輸出。 根據預設,Git 資料夾的系統管理設定不允許認可 .ipynb
筆記本輸出。 如果您有工作區的系統管理員許可權,您可以變更此設定:
在 Azure Databricks 系統管理員控制台中,移至 系統管理員設定>工作區設定。
在 [Git 資料夾] 下,選擇 [允許 Git 資料夾匯出 IPYNB 輸出],然後選擇 [允許]:[可以切換開啟 IPYNB 輸出]。
重要
包含輸出時,視覺效果和儀錶板組態會包含在您建立的.ipynb
筆記本中。
控制IPYNB筆記本輸出工件提交
當您提交 .ipynb
檔案時,Databricks 會建立設定檔,讓您控制提交輸出的方式:.databricks/commit_outputs
。
如果您有
.ipynb
筆記本檔案,但在遠端存放庫中沒有設定檔,請移至 [Git 狀態] 對話框。在通知對話框中,選取 建立commit_outputs檔案。
您也可以從 [檔案] 功能表產生組態檔。 [檔案] 選單中有一個選項,可以自動更新配置檔,您可以在其中指定特定 IPYNB 筆記本的輸出包含或排除。
在 [檔案] 功能表中,選取 [認可筆記本輸出] 。
在對話框中,確認您確認提交筆記本輸出。