Databricks JDBC 驅動程式的驅動程式功能設定
本文說明如何設定 Databricks JDBC 驅動程式的特殊和進階驅動程式功能設定。
Databricks JDBC 驅動程式提供下列特殊和進階的驅動程式功能設定。
JDBC 中的 ANSI SQL-92 查詢支援
舊版 Spark JDBC 驅動程式接受 ANSI SQL-92 方言中的 SQL 查詢,並將查詢轉譯至 Databricks SQL 方言,再將它們傳送至伺服器。 不過,如果您的應用程式直接產生 Databricks SQL,或您的應用程式使用 Azure Databricks 特有的任何非 ANSI SQL-92 標準 SQL 語法,Databricks 建議您將 UseNativeQuery=1
設定為聯機組態。 使用該設定,驅動程式會將 SQL 查詢逐字傳遞至 Azure Databricks。
預設目錄和架構
若要指定預設目錄和架構,請將 ConnCatalog=<catalog-name>;ConnSchema=<schema-name>
新增至 JDBC 連線 URL。
在 JDBC 中擷取大型查詢結果
若要在擷取大型查詢結果時達到最佳效能,請使用最新版的 JDBC 驅動程式,其中包含下列優化。
JDBC 中的箭號串行化
JDBC 驅動程式 2.6.16 版和更新版本支援使用 Apache Arrow 的優化查詢結果串行化格式。
JDBC 中的雲端擷取
JDBC 驅動程式 2.6.19 版和更新版本支援 Cloud Fetch,此功能可透過 Azure Databricks 部署中設定的雲端記憶體來擷取查詢結果。
查詢結果會上傳至內部 DBFS 儲存位置 ,做為最多 20 MB 的箭號串行化檔案。 當驅動程式在查詢完成之後傳送擷取要求時,Azure Databricks 會產生並傳回 上傳檔案的共用存取簽章 。 JDBC 驅動程式接著會使用 URL 直接從 DBFS 下載結果。
雲端擷取僅用於大於 1 MB 的查詢結果。 較小的結果會直接從 Azure Databricks 擷取。
Azure Databricks 會自動垃圾收集累積的檔案,這些檔案會在 24 小時後標示為要刪除。 這些標示的檔案會在額外 24 小時後完全刪除。
若要深入瞭解雲端擷取架構,請參閱 如何使用BI工具實現高頻寬連線。
啟用 記錄
若要在 JDBC 驅動程式中啟用記錄,請將 1
的 LogLevel
屬性設定為只透過 6
記錄嚴重事件,以記錄所有驅動程序活動。 將 LogPath
屬性設定為您想要儲存記錄檔的資料夾完整路徑。