PostgreSQL データベース CDC をソースとしてリアルタイム ハブに追加する
この記事では、PostgreSQL データベース変更データ キャプチャ (CDC) を Fabric リアルタイム ハブのイベント ソースとして追加する方法について説明します。
Microsoft Fabric イベント ストリームの PostgreSQL データベース 変更 データ キャプチャ (CDC) ソース コネクタは、PostgreSQL データベースの現在のデータのスナップショットをキャプチャすることができます。 コネクタは、このデータに対する将来の行レベルの変更を監視し、記録します。
前提条件
共同作成者以上のアクセス許可を使用した Fabric 容量ライセンス モード (または試用版ライセンス モード) でのワークスペースへのアクセス。
PostgreSQLデータベースへの登録済みユーザーアクセス。
PostgreSQL データベースで CDC が有効になっている。
PostgreSQL 用の Azure データベースがある場合は、次のセクションの手順に従って CDC を有効にします。 詳細の情報については「論理レプリケーションと論理デコード - PostgreSQL 用 Azure データベース - フレキシブル サーバー」を参照してください。
その他の PostgreSQL データベースについては「PostgreSQL 用の Debezium コネクタ :: Debezium のドキュメント」を参照してください。
Note
複数テーブルの CDC はサポートされていません。
PostgreSQL 用の Azure データベースで CDC を有効にする
PostgreSQL用のAzureデータベース で CDC を有効にするには、展開の種類に基づいて次の手順に従います。
Azure Database for PostgreSQL - 単一サーバー
Azure portal の [レプリケーション] ページに移動します。
レプリケーション ルールを論理に変更します。
PostgreSQLフレキシブル サーバー用 Azure データベース
Azure portal の Azure Database for PostgreSQL フレキシブル サーバー ページで、ナビゲーション メニューのサーバー パラメーターを選択します。
サーバーパラメータページで
wal_levelをlogicalに設定します。
max_worker_processesを少なくとも16 に更新します。
変更点を保存し、サーバーを再起動します。
PostgreSQL フレキシブル サーバー インスタンス用の Azure データベースでパブリック ネットワーク トラフィックが許可されていることを確認します。
次の SQL ステートメントを実行して、管理者 ユーザーにレプリケーションアクセス許可権限を許可します。
ALTER ROLE <admin user> WITH REPLICATION;
Azure Database for PostgreSQL CDC からイベントを取得する
次のいずれかの方法で、Azure Database for PostgreSQL CDC からリアルタイム ハブにイベントを取得できます。
データ ソース ページ
Microsoft Fabric にサインインします。
左側のナビゲーション バーで [リアルタイム] を選択します。
[リアルタイム ハブ] ページで、左側のナビゲーション メニューの [接続先] の下にある [+ データ ソース] を選択します。 また、右上にある [+ データ ソースに接続] ボタンを選択して、[すべてのデータ ストリーム] ページまたは [マイ データ ストリーム] ページから [データ ソース] ページにアクセスすることもできます。
[データ ソース ] ページで、上部にある [Microsoft ソース] カテゴリを選択し、[Azure DB for PostgreSQL (CDC)] タイルの [ 接続] を選択します。
ソースとして PostgreSQL データベース CDC を追加するセクションの手順を使用します。
[Microsoft ソース] ページ
リアルタイム ハブで、[Microsoft ソース] を選択します。
[ソース] ドロップダウン リストで、[PostgreSQL (CDC)] を選択します。
[サブスクリプション] で、使用する PostgreSQL データベース アカウントがあるリソース グループを含む Azure サブスクリプションを選択します。
[リソース グループ] では、お使いの IoT ハブのあるリソース グループを選択します。
[リージョン] では、IoT ハブのある場所を選択します。
次に、データベースの一覧でリアルタイム ハブに接続する PostgreSQL データベース CDC ソースの名前の上にマウスを移動し、[接続] ボタンを選択するか、[...] を選択します。(省略記号) をクリックし、[接続] ボタンを選択します。
接続情報を構成するには、「Azure Database for PostgreSQL CDC をソースとして追加する」セクションの手順を使用します。
PostgreSQL CDC の Azure データベースをソースとして追加する
接続ページで、新しい接続 を選択します。
Azure Database for PostgreSQL CDC ソースへの既存の接続がある場合は、[接続] ドロップダウン リストからそれを選択して、ポートとテーブルの構成に進むことができます。
接続設定セクションで、次の情報を入力します。
サーバー: PostgreSQL データベースのサーバー アドレス (my-pgsql-server.postgres.database.azure.com など)。
データベース: データベース名 (my_database など)。
下にスクロールし、[接続資格情報] セクションで、次の 手順に従います。
接続名 には、接続の名前を入力します。
[認証の種類] で、[Basic] を選択します。
Note
現在、ファブリック イベント ストリームはBasic認証のみをサポートしています。
データベースで、[ユーザー名] と [パスワード] を入力します。
接続を選択します。
次に、[接続] ページで、次の手順を実行します。
[確認と接続] ページで概要を確認してから、[接続] を選択します。
データ ストリームの詳細を表示する
[確認と接続] ページで [イベントストリームを開く] を選択すると、選択した PostgreSQL Database CDC をソースとして作成されたイベントストリームがウィザードで開きます。 ウィザードを閉じるには、ページの下部にある [完了] を選択します。
リアルタイム ハブで、[マイ データ ストリーム] を選択します。 新しいデータ ストリームを表示するには、ページを最新の情報に更新します。
関連するコンテンツ
データ ストリームの使用について詳しくは、次の記事を参照してください。