將 Postgre SQL 資料庫 CDC 來源新增至 Eventstream
本文說明如何將 Postgre SQL 資料庫 異動資料擷取 (CDC) 來源新增至 Eventstream。
適用於 Microsoft Fabric 事件串流的 PostgreSQL 資料庫異動資料擷取 (CDC) 來源連接器,讓您擷取 PostgreSQL 資料庫中目前資料的快照。 接著,連接器會監視並記錄此資料的任何未來資料列層級變更。 一旦在 Eventstream 中擷取變更,您可以即時處理此 CDC 資料,並將其傳送至 Fabric 中的不同目的地,以執行進一步處理或分析。
注意
工作區容量的下列區域不支援此來源: 美國西部 3、 瑞士西部。
必要條件
在 Fabric 容量授權模式中存取工作區,或具有參與者或更高許可權的試用版授權模式。
PostgreSQL 資料庫中已註冊的使用者存取權。
您的 PostgreSQL 資料庫必須可公開存取,且不可位於防火牆後方或在 Azure 虛擬網路中受保護。
在 PostgreSQL 資料庫和資料表中啟用 CDC。
如果您有 適用於 PostgreSQL 的 Azure 資料庫,請遵循下一節中的步驟來啟用 CDC。 如需詳細資訊,請參閱邏輯複寫和邏輯解碼 - 適用於 PostgreSQL 的 Azure 資料庫 - 彈性伺服器。
如需其他 PostgreSQL 資料庫,請參閱 PostgreSQL 的 Debezium 連接器::D ebezium 檔。
如果您沒有 eventstream, 請建立 eventstream。
在適用於 PostgreSQL 的 Azure 資料庫中啟用 CDC。
若要在適用於 PostgreSQL 的 Azure 資料庫彈性伺服器中啟用 CDC,請依照這些步驟進行:
在 Azure 入口網站中的適用於 PostgreSQL 的 Azure 資料庫彈性伺服器頁面上,選取導覽功能表中的伺服器參數。
在 [ 伺服器參數] 頁面上:
- 將 wal_level 設定為 logical。
- 將 max_worker_processes 更新為至少 16。
儲存變更並重新啟動伺服器。
確認適用於 PostgreSQL 的 Azure 資料庫彈性伺服器執行個體允許公用網路流量。
執行下列 SQL 語句, 以授與系統管理員用戶 復寫權限。 如果您想要使用其他使用者帳戶來連線 PostgreSQL DB 來擷取 CDC,請確定使用者是 資料表擁有者。
ALTER ROLE <admin_user_or_table_owner_user> WITH REPLICATION;
啟動選取數據源精靈
如果您尚未將任何來源新增至事件串流,請選取 [ 使用外部來源 ] 圖格。
如果您要將來源新增至已發行的事件串流,請切換至 [編輯 模式],選取 功能區上的 [新增來源 ],然後選取 [ 外部來源]。
在 [選取數據源] 頁面上,搜尋並選取 [適用於 PostgreSQL 的 Azure DB] 圖格上的 [連線]。
設定及連線至適用於 PostgreSQL 的 Azure 資料庫 CDC
在連線頁面上,選取新增連線。
在連線設定區段中,輸入下列資訊。
伺服器:PostgreSQL 資料庫的伺服器位址,例如 my-pgsql-server.postgres.database.azure.com。
資料庫:資料庫名稱,例如 my_database。
向下卷動,然後在 [ 連線認證 ] 區段中,遵循下列步驟。
對於連線名稱,請輸入連線的名稱。
針對 [ 驗證種類],選取 [ 基本]。
注意
目前,Fabric 事件串流僅支援基本身份驗證。
輸入資料庫的使用者名稱和密碼。
選取 Connect。
現在,在 [ 連線] 頁面上,執行下列步驟:
在 [ 檢閱 + 連線 ] 頁面上,檢閱摘要,然後選取 [ 新增]。
注意
一個 Eventstream 的來源和目的地數目上限為 11。
檢視更新的事件串流
您可以在編輯模式中看到 Postgre SQL 資料庫 CDC 來源新增至 Eventstream。
若要實作這個新增的 PostgreSQL DB CDC 來源,請選取 [ 發佈]。 完成這些步驟之後,PostgreSQL DB CDC 來源可在即時檢視中提供視覺效果。
相關內容
其他連接器: