將數據內嵌至 Databricks Lakehouse
Azure Databricks 提供各種方式,可將各種來源的數據內嵌到 Delta Lake 支援的 Lakehouse。 本文列出數據源,並提供從每個來源類型擷取數據的步驟連結。
雲端物件儲存體
若要瞭解如何從雲端物件記憶體設定累加擷取,請參閱 從雲端物件記憶體擷取數據。
LakeFlow Connect
Databricks LakeFlow Connect 提供原生連接器,可從企業應用程式和資料庫擷取。 產生的擷取管線是由 Unity 目錄所控管,並由無伺服器計算和 Delta 實時數據表提供電源。
LakeFlow Connect 利用有效率的累加式讀取和寫入,讓數據擷取更快、更具延展性且更具成本效益,而您的數據仍為下游耗用量保持新鮮狀態。
串流來源
Azure Databricks 可以與串流傳訊服務整合,以便近乎實時的數據擷取至 Lakehouse。 請參閱 串流和累加擷取。
本機數據檔
您可以安全地上傳本機數據檔,或從公用 URL 下載檔案。 請參閱將檔案上傳至 Azure Databricks。
將數據遷移至 Delta Lake
若要瞭解如何將現有的數據遷移至 Delta Lake,請參閱 將數據遷移至 Delta Lake。