DBeaver 與 Azure Databricks 整合
注意
本文涵蓋 DBeaver,Databricks 既未提供也不支援。 若要連絡提供者,請參閱在 GitHub 上使用 dbeaver/dbeaver 存放庫的 [問題] 頁面。
DBeaver 是本機、多平台資料庫工具,適用於開發人員、資料庫管理員、數據分析師、數據工程師,以及其他需要使用資料庫的人員。 DBeaver 支援 Azure Databricks 和其他熱門資料庫。
本文說明如何使用本機開發計算機來安裝、設定及使用免費的 開放原始碼 DBeaver Community Edition (CE) 來使用 Azure Databricks 中的資料庫。
注意
本文已經過 macOS、 Databricks JDBC Driver 2.6.36 版和 DBeaver CE 23.3.0 版的測試。
需求
安裝 DBeaver 之前,您的本機開發計算機必須符合下列需求:
- Linux 64 位、macOS 或 Windows 64 位作業系統。 (支援 Linux 32 位,但不建議使用。
- Databricks JDBC Driver 到本機開發計算機,從下載
DatabricksJDBC42-<version>.zip
的檔案中擷取DatabricksJDBC42.jar
檔案。
您也必須有 Azure Databricks 叢集 或 SQL 倉儲 ,才能與 DBeaver 連線。
步驟 1:安裝 DBeaver
下載並安裝 DBeaver CE ,如下所示:
- Linux:從 DBeaver 網站上的 [下載] 頁面下載 並執行其中一個 Linux 安裝程式。
snap
此頁面也提供 和flatpak
安裝選項。 - macOS:使用 Homebrew 執行
brew install --cask dbeaver-community
,或使用 MacPorts 執行sudo port install dbeaver-community
。 macOS 安裝程式也可從 DBeaver 網站上的 [下載 ] 頁面取得。 - Windows:使用 Chocolatey 執行
choco install dbeaver
。 Windows 安裝程式也可從 DBeaver 網站上的 [下載 ] 頁面取得。
步驟 2:設定 Azure Databricks JDBC Driver for DBeaver
使用您稍早下載的 Databricks JDBC 驅動程式相關信息來設定 DBeaver。
- 啟動 DBeaver。
- 如果系統提示您建立新的資料庫,請按兩下 [ 否]。
- 如果系統提示您連線或選取資料庫,請按兩下 [ 取消]。
- 按兩下 [資料庫 > 驅動程式管理員]。
- 在 [ 驅動程式管理員] 對話框中,按兩下 [ 新增]。
- 在 [ 建立新的驅動程式 ] 對話框中,按兩下 [連結 庫] 索引標籤 。
- 按一下 [加入檔案]。
- 流覽至您擷取 Azure Databricks JDBC Driver 的資料夾。
- 流覽較低層級以尋找
.jar
檔案。 - 反白顯示檔案,
.jar
然後按兩下 [ 開啟]。 - 在 [設定] 索引標籤的 [驅動程式名稱] 中, 輸入
Databricks
。 - 在 [設定] 索引標籤的 [類別名稱] 中, 輸入
com.databricks.client.jdbc.Driver
。 - 按一下 [確定]。
- 在 [ 驅動程式管理員] 對話框中,按兩下 [ 關閉]。
步驟 3:將 DBeaver 連線 至 Azure Databricks 資料庫
使用 DBeaver 連線到叢集或 SQL 倉儲,以存取 Azure Databricks 工作區中的資料庫。
在 DBeaver 中,按兩下 [資料庫>新增資料庫] 連線 ion。
在 [資料庫 連線] 對話框中,按兩下 [所有] 索引標籤上的 [Databricks],然後按 [下一步]。
單擊 [主要] 索引標籤,然後在 Azure Databricks 資源的 [JDBC URL] 字段中輸入值。 如需 JDBC URL 字段語法,請參閱 Databricks JDBC Driver 的驗證設定。
按一下 [測試連接] 。
提示
測試連線之前,您應該先啟動 Azure Databricks 資源。 否則,在資源啟動時,測試可能需要幾分鐘的時間才能完成。
如果連線成功,請在 [連線 ion 測試] 對話框中,按兩下 [確定]。
在 [資料庫 連線] 對話框中,按兩下 [完成]。
在 [ 資料庫導覽器 ] 視窗中, 會顯示 Databricks 專案。 若要變更連線的名稱,使其更容易識別:
- 以滑鼠右鍵按兩下 Databricks,然後按兩下 [編輯 連線]。
- 在 [連線 ion 組態] 對話框中,按兩下 [一般]。
- 若為 連線 ion 名稱,請將 取代
Databricks
為連線的不同名稱。 - 按一下 [確定]。
針對您想要 DBeaver 存取的每個資源,重複此步驟中的指示。
步驟 4:使用 DBeaver 瀏覽數據物件
使用 DBeaver 存取 Azure Databricks 工作區中的數據物件,例如數據表和數據表屬性、檢視表、索引、數據類型和其他數據物件類型。
在 DBeaver 的 [ 資料庫導覽器 ] 視窗中,以滑鼠右鍵按下您想要使用的連線。
如果已啟用 連線,請按下它。 (If 連線 已停用,您已連線。
提示
您應該先啟動您的資源,再嘗試連線到該資源。 否則,資源啟動時,連線可能需要幾分鐘的時間才能完成。
展開您剛才連線的連線。
展開並流覽可用的數據物件。 按兩下資料物件以取得其詳細資訊。
重複此步驟中的指示以存取其他數據物件。
步驟 5:使用 DBeaver 執行 SQL 語句
使用 DBeaver 從samples
目錄的nyctaxi
架構載入範例trips
數據表。
在 DBeaver 的 [ 資料庫導覽器 ] 視窗中,以滑鼠右鍵按下您想要使用的連線。
如果已啟用 連線,請按下它。 (If 連線 已停用,您已連線。
提示
您應該先啟動您的資源,再嘗試連線到該資源。 否則,資源啟動時,連線可能需要幾分鐘的時間才能完成。
按兩下 [ SQL 編輯器 > ] [新增 SQL 文稿]。
在 [ 連線名稱] Script-1 索引標籤上,輸入此 SQL 語句:
SELECT * FROM samples.nyctaxi.trips;
按兩下 [ SQL 編輯器 > 執行 SQL 腳稿]。
下一步
- 使用 Database 物件編輯器來處理資料庫物件屬性、數據和實體關聯圖表。
- 使用數據編輯器來檢視和編輯資料庫數據表或檢視中的數據。
- 使用 SQL 編輯器來處理 SQL 腳本。
- 使用 DBeaver 中的實體關聯圖 (ERDs)。
- 從 DBeaver 匯入和匯出數據 。
- 使用 DBeaver 遷移數據 。
- 針對 DBeaver 的 JDBC 驅動程式問題 進行疑難解答。