共用方式為


Databricks JDBC 驅動程式的驅動程式功能設定

本文說明如何設定 Databricks JDBC 驅動程式的特殊和進階驅動程式功能設定。

Databricks JDBC 驅動程式提供下列特殊和進階的驅動程式功能設定。

JDBC 中的 ANSI SQL-92 查詢支援

舊版 Spark JDBC 驅動程式接受 ANSI SQL-92 方言中的 SQL 查詢,並將查詢轉譯至 Databricks SQL 方言,再將它們傳送至伺服器。 不過,如果您的應用程式直接產生 Databricks SQL,或您的應用程式使用 Azure Databricks 特有的任何非 ANSI SQL-92 標準 SQL 語法,Databricks 建議您 setUseNativeQuery=1 作為連線設定。 使用該設定,驅動程式會將 SQL 查詢逐字傳遞至 Azure Databricks。

預設 catalog 和 schema

若要指定預設 catalog 和 schema,請將 ConnCatalog=<catalog-name>;ConnSchema=<schema-name> 新增至 JDBC 連線 URL。

在 JDBC 中擷取大型查詢結果

若要在擷取大型查詢結果時達到最佳效能,請使用最新版的 JDBC 驅動程式,其中包含下列優化。

JDBC 中的箭號串行化

JDBC 驅動程式 2.6.16 版和更新版本支援使用 Apache Arrow 的優化查詢結果串行化格式。

JDBC 中的雲端擷取

JDBC 驅動程式 2.6.19 版和更新版本支援 Cloud Fetch,此功能可透過 Azure Databricks 部署中 set 的雲端記憶體擷取查詢結果。

查詢結果會上傳至內部 DBFS 儲存位置 ,做為最多 20 MB 的箭號串行化檔案。 當驅動程式在查詢完成之後傳送擷取要求時,Azure Databricks 會產生並傳回 上傳檔案的共用存取簽章 。 JDBC 驅動程式接著會使用 URL 直接從 DBFS 下載結果。

雲端擷取僅用於大於 1 MB 的查詢結果。 較小的結果會直接從 Azure Databricks 擷取。

Azure Databricks 會自動垃圾收集累積的檔案,這些檔案會在 24 小時後標示為要刪除。 這些標示的檔案會在額外 24 小時後完全刪除。

若要深入瞭解雲端擷取架構,請參閱 如何使用BI工具實現高頻寬連線。

啟用 記錄

若要在 JDBC 驅動程式中啟用記錄,應該將 LogLevel 屬性從 set 變更為 1 ,以通過 6 從只記錄嚴重事件到記錄所有驅動程序活動。 將 Set 的 LogPath 屬性設定為您要儲存記錄檔的資料夾 where 的完整路徑。

如需詳細資訊,請參閱 Configuring Logging中的 一節。