Ajouter la CDC de la base de données PostgreSQL en tant que source dans le hub en temps réel
Cet article explique comment ajouter la capture des changements de données (CDC) de la base de données PostgreSQL en tant que source d’événements dans le hub En temps réel Fabric.
Le connecteur source de capture des changements de données (CDC) PostgreSQL Database pour les eventstreams Microsoft Fabric vous permet de capturer un instantané des données actuelles dans une base de données PostgreSQL. Le connecteur surveille et enregistre ensuite les modifications futures au niveau des lignes apportées à ces données.
Prérequis
Accès à un espace de travail en mode licence de capacité Fabric ou en mode licence d’évaluation avec des autorisations Collaborateur ou supérieures.
Accès utilisateur inscrit dans la base de données PostgreSQL.
CDC activée dans la base de données PostgreSQL.
Si vous avez Azure Database pour PostgreSQL, suivez les étapes de la section suivante pour activer la CDC. Pour des informations détaillées, consultez Réplication logique et décodage logique - Serveur flexible Azure Database pour PostgreSQL.
Pour les autres bases de données PostgreSQL, consultez le connecteur Debezium pour PostgreSQL :: Documentation de Debezium.
Remarque
La CDC de plusieurs tables n’est pas prise en charge.
Activer la CDC dans votre Azure Database pour PostgreSQL
Pour activer la CDC dans votre Azure Database pour PostgreSQL, suivez ces étapes en fonction de votre type de déploiement.
Serveur unique Azure Database pour PostgreSQL
Accédez à la page Réplication du portail Azure.
Remplacez la règle de réplication par Logique.
Azure Database pour PostgreSQL - Serveur flexible
Sur la page de votre serveur Azure Database pour PostgreSQL, sélectionnez Paramètres du serveur dans le menu de navigation.
Sur la page Paramètres du serveur :
Définir wal_level sur logique.
Mettez à jour le max_worker_processes sur au moins 16.
Enregistrez les modifications et redémarrez le serveur.
Vérifiez que votre instance de serveur flexible Azure Database pour PostgreSQL autorise le trafic réseau public.
Accordez les autorisations de réplication de l’utilisateur administrateur en exécutant l’instruction SQL suivante.
ALTER ROLE <admin user> WITH REPLICATION;
Obtenir des événements à partir d’une capture des changements de données (CDC) Azure DB pour PostgreSQL
Vous pouvez obtenir des événements à partir d’une capture des changements de données Azure Database pour PostgreSQL dans un hub en temps réel de l’une des façons suivantes :
Page Sources de données
Connectez-vous à Microsoft Fabric.
Sélectionnez En temps réel dans la barre de navigation gauche.
Sur la page Hub en temps réel, sélectionnez + Sources de données sous Se connecter à dans le menu de navigation de gauche. Vous pouvez également accéder à la page Sources de données à partir des pages Tous les flux de données ou Mes flux de données en sélectionnant le bouton + Se connecter à la source de données dans le coin supérieur droit.
Sur la page Sources de données, sélectionnez la catégorie Sources Microsoft en haut, puis sélectionnez Se connecter dans la vignette Azure DB pour PostgreSQL (CDC).
Utilisez des instructions de la section Ajouter CDC de base de données PostgreSQL en tant que source.
Page sources Microsoft
Dans le hub en temps réel, sélectionnez Sources Microsoft.
Dans la liste déroulante Source, sélectionnez PostgreSQL (CDC).
Pour Abonnement, sélectionnez un abonnement Azure qui dispose du groupe de ressources avec votre compte de base de données PostgreSQL.
Pour Groupe de ressources, sélectionnez un groupe de ressources qui possède votre base de données.
Pour Région, sélectionnez un emplacement où se trouve votre base de données.
Maintenant, pointez avec la souris sur le nom de la source CDC de la base de données PostgreSQL que vous souhaitez connecter au hub en temps réel dans la liste des bases de données, puis sélectionnez le bouton Connecter, ou sélectionnez ... (points de suspension), puis le bouton Connecter.
Pour configurer les informations de connexion, utilisez les étapes de la section Ajouter une CDC Azure Database pour PostgreSQL comme source.
Ajoutez la CDC d’Azure Database pour PostgreSQL en tant que source
Sur la page Connecter, sélectionnez Nouvelle connexion.
Si vous disposez d’une connexion existante à votre source CDC Azure Database pour PostgreSQL, vous pouvez la sélectionner dans la liste déroulante Connexion et passer à la configuration du port et des tables.
Dans la section Paramètres de connexion, saisissez les informations suivantes :
Serveur : adresse du serveur de votre base de données PostgreSQL, par exemple my-pgsql-server.postgres.database.azure.com.
Base de données : nom de la base de données, par exemple my_database.
Faites défiler vers le bas et, dans la section Identifiants de connexion, suivez les étapes suivantes :
Dans le champ Nom de la connexion, saisissez un nom pour la connexion.
Pour le type d’authentification, sélectionnez De base.
Remarque
Actuellement, les eventstreams Fabric ne prennent en charge que l’authentification de base.
Entrez le nom d'utilisateur et le mot de passe de la base de données.
Sélectionnez Connecter.
À présent, à la page Connecter, suivez ces étapes :
Dans Table, saisissez un nom de table.
Pour port, saisissez le numéro de port ou conservez la valeur par défaut : 5432.
Pour le nom de l’Eventstream, saisissez un nom pour l’Eventstream. L’assistant crée un Eventstream avec la CDC de la base de données PostgreSQL sélectionnée comme source.
Le nom du flux est généré automatiquement pour vous en ajoutant -stream au nom de l’Eventstream. Ce flux s’affiche sur la page Tous les flux de données à la fin de l’assistant.
Sélectionnez Suivant au bas de la page.
Sur la page Vérifier + se connecter, vérifiez le résumé, puis sélectionnez Se connecter.
Afficher les détails du flux de données
Dans la page Vérifier + se connecter, si vous sélectionnez Ouvrir un eventstream, l’assistant ouvre l’eventstream qu’il a créé pour vous avec la CDC PostgreSQL Database sélectionné comme source. Pour fermer l’assistant, sélectionnez Terminer en bas de la page.
Dans le hub en temps réel, sélectionnez Mes flux de données. Pour afficher le nouveau flux de données, actualisez la page.
Contenu connexe
Pour en savoir plus sur l’utilisation de flux de données, consultez les articles suivants :