共用方式為


探索資料

Azure Databricks 提供一套工具和產品,可簡化透過 Databricks Data Intelligence Platform 存取的資料資產探索。 本文提供有關您如何探索和預覽已在工作區中設定以供存取之資料的固執己見概觀。

本節中的主題著重於探索資料物件和資料檔案。 如果您要尋找有關使用諸如筆記本、SQL 查詢、程式庫和模型等資產的相關資訊,請參閱瀏覽工作區

如果您要尋找有關與探索資料分析 (EDA) 相關聯的資料集或其他任務的生成摘要統計資料指引,請參閱 Azure Databricks 上的探索資料分析:工具和技術

如何探索資料資產?

Azure Databricks 上的資料探索工具分為下列一般類別:

  • AI 輔助的深入解析、摘要和搜尋。
  • 關鍵字搜尋。
  • 使用 UI 進行目錄探索。
  • 程式設計清單和中繼資料探索。

數據探索工具已針對 Unity 目錄控管的數據進行優化。 未註冊為 Unity Catalog 對象的數據資產可能無法使用其中一些方法來探索。

使用 UI 尋找資料

目錄總管提供探索及控管數據資產的工具。 您可以在工作區側邊欄中使用 目錄圖示目錄 來存取目錄總管。 請參閱 什麼是目錄總管?

筆記本和 SQL 查詢編輯器也提供目錄導覽器來探索資料庫物件。 按兩下這些介面中的 目錄 圖示,即可展開或折疊目錄導覽器,而不需離開程式碼編輯器。

探索到感興趣的資料集之後,您可以使用 [深入解析] 索引標籤來了解如何在工作區中使用資料。 請參閱 檢視表格中頻繁的查詢和使用者。

以程序設計方式探索資料

您可以在所有資料庫物件上使用 SHOW 命令來探索註冊至 Unity 目錄的資產。 使用 LIST 命令、%fs magic 命令或 Databricks 公用程式來列出檔案。

請參閱探索儲存體並尋找資料檔案探索資料庫物件

檢閱資料註解

您可以檢閱註解,以了解 Lakehouse 中可用的資料集內容。 您可以在資料物件上設定批註,包括目錄、架構、資料表和數據行。 您可以在目錄瀏覽器中檢視註解,或使用對象的 DESCRIBE 指令。

目錄總管可為數據表提供 AI 產生的批注,讓數據資產擁有者輕鬆地提供豐富的數據集概觀。 請參閱 將 AI 產生的批註新增至 Unity Catalog 物件

使用者也可以選擇性地使用 Markdown 為數據表和其他資料庫物件提供批注,這些批注將在目錄總管中呈現。 請參閱將註解新增至資料和 AI 資產

搜尋 Lakehouse 中的數據表

您可以使用 Azure Databricks 中的搜尋列來尋找已註冊至 Unity 目錄的數據表。 您可以執行關鍵詞搜尋或使用語意搜尋來尋找與搜尋查詢相關的數據集或數據行。 搜尋只會傳回您有權查看之數據表的結果。 搜尋檢閱數據表名稱、數據行名稱、數據表批註和數據行批註。 請參閱搜尋工作區物件