共用方式為


將數據內嵌至 Databricks Lakehouse

Azure Databricks 提供各種方式,可將各種來源的數據內嵌到 Delta Lake 支援的 Lakehouse。 本文列出數據源,並提供從每個來源類型擷取數據的步驟連結。

雲端物件儲存體

若要瞭解如何從雲端物件記憶體設定累加擷取,請參閱 從雲端物件記憶體擷取數據。

LakeFlow Connect

Databricks LakeFlow Connect 提供原生連接器,可從企業應用程式和資料庫擷取。 產生的擷取管線是由 Unity 目錄所控管,並由無伺服器計算和 Delta 實時數據表提供電源。

LakeFlow Connect 利用有效率的累加式讀取和寫入,讓數據擷取更快、更具延展性且更具成本效益,而您的數據仍為下游耗用量保持新鮮狀態。

串流來源

Azure Databricks 可以與串流傳訊服務整合,以便近乎實時的數據擷取至 Lakehouse。 請參閱 串流和累加擷取

本機數據檔

您可以安全地上傳本機數據檔,或從公用 URL 下載檔案。 請參閱 將檔案上傳至 Azure Databricks

將數據遷移至 Delta Lake

若要瞭解如何將現有的數據遷移至 Delta Lake,請參閱 將數據遷移至 Delta Lake