共用方式為


將數據內嵌至 Databricks Lakehouse

Azure Databricks 提供各種方式,可將各種來源的數據內嵌到 Delta Lake 支援的 Lakehouse。 本文列出數據源,並提供從每個來源類型擷取數據的步驟連結。

雲端物件儲存體

若要瞭解如何從雲端物件記憶體設定累加擷取,請參閱 從雲端物件記憶體擷取數據。

LakeFlow Connect

Databricks LakeFlow Connect 提供原生連接器,可從企業應用程式和資料庫擷取。 產生的擷取管線由 Unity Catalog 控管,並由無伺服器運算及 Delta Live Tables提供支援。

LakeFlow Connect 利用有效率的累加式讀取和寫入,讓數據擷取更快、更具延展性且更具成本效益,而您的數據仍為下游耗用量保持新鮮狀態。

串流來源

Azure Databricks 可以與串流傳訊服務整合,以便近乎實時的數據擷取至 Lakehouse。 請參閱 串流和累加擷取

本機數據檔

您可以安全地上傳本機數據檔,或從公用 URL 下載檔案。 請參閱將檔案上傳至 Azure Databricks

將數據遷移至 Delta Lake

若要瞭解如何將現有的數據遷移至 Delta Lake,請參閱 將數據遷移至 Delta Lake