共用方式為


無伺服器計算的最佳做法

本文會提供在筆記本和作業中使用無伺服器計算的最佳作法建議。

遵循這些建議,您將提升 Azure Databricks 上工作負載的生產力、成本效益和可靠性。

將工作負載遷移至無伺服器計算

為了保護使用者程式碼的隔離,無伺服器計算會利用 Azure Databricks 保護共用存取模式。 因此,某些工作負載需要變更程式碼,才能繼續處理無伺服器計算。 如需不支援的功能清單,請參閱 無伺服器計算限制

某些工作負載比其他工作負載更容易移轉。 符合下列需求的工作負載將是最容易移轉的工作負載:

  • 要存取的資料必須儲存在 Unity 目錄中。
  • 工作負載應該與共用存取模式計算相容。
  • 工作負載應該與 Databricks Runtime 14.3 或更新版本相容。

若要測試工作負載是否會在無伺服器計算上運作,請在具有共用存取模式的非無伺服器計算資源上執行工作負載,以及 14.3 或更新版本的 Databricks Runtime。 如果執行成功,工作負載就已準備好進行移轉。

由於這項變更的意義和目前的限制清單,許多工作負載不會順暢地移轉。 Azure Databricks 建議在建立新的工作負載時,優先處理無伺服器計算相容性,而不是重新編碼所有專案。

從外部系統擷取資料

因為無伺服器計算不支援 JAR 檔案安裝,所以您無法使用 JDBC 或 ODBC 驅動程式從外部資料源內嵌資料。

您可以用於擷取的替代策略包括:

擷取替代選項

使用無伺服器計算時,您也可以使用下列功能來查詢您的資料,而不移動資料。

  • 如果您想要限制資料重複,或保證您查詢最新的可能資料,Databricks 建議使用 Delta Sharing。 請參閱什麼是 Delta Sharing?
  • 如果您想要進行臨機操作報告和概念證明工作,Databricks 建議嘗試正確的選擇,這可能是 Lakehouse 同盟。 Lakehouse 同盟可讓您從外部系統將整個資料庫同步處理至 Azure Databricks,並由 Unity 目錄控管。 請參閱 什麼是 Lakehouse 同盟?

嘗試其中一項或兩項功能,並查看它們是否符合您的查詢效能需求。

監視無伺服器計算的成本

您可以使用多個功能來協助您監視無伺服器計算的成本: