Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se muestra cómo agregar un origen de captura de datos modificados (CDC) de base de datos de PostgreSQL a una secuencia de eventos.
El conector de origen de captura de datos modificados de base de datos de PostgreSQL (CDC) para secuencias de eventos de Microsoft Fabric permite capturar una instantánea de los datos actuales en una base de datos PostgreSQL. Actualmente, la captura de datos modificados de base de datos de PostgreSQL (CDC) se admite desde los siguientes servicios a los que se puede acceder públicamente a las bases de datos:
- Azure Database para PostgreSQL
- Amazon RDS for PostgreSQL
- Amazon Aurora PostgreSQL
- Google Cloud SQL for PostgreSQL
Una vez que el origen CDC de la base de datos PostgreSQL se agrega al flujo de eventos, captura los cambios de nivel de fila en las tablas especificadas. Estos cambios se pueden procesar en tiempo real y enviarlos a diferentes destinos para su posterior análisis.
Nota:
Este origen no se admite en las siguientes regiones de la capacidad del área de trabajo: Oeste de EE. UU. 3, Oeste de Suiza.
Requisitos previos
Acceso a un área de trabajo en el modo de licencia de capacidad de Fabric (o) el modo de licencia de prueba con permisos de Colaborador o superiores.
Acceso de usuario registrado en la base de datos de PostgreSQL.
La base de datos de PostgreSQL debe ser accesible públicamente y no estar detrás de un firewall o protegido en una red virtual.
El CDC está habilitado en la base de datos y en las tablas de PostgreSQL.
Si tiene Azure Database for PostgreSQL, siga los pasos de la sección siguiente para habilitar CDC. Para obtener información detallada, consulte Replicación lógica y descodificación lógica: Azure Database for PostgreSQL con servidor flexible.
Para otras base de datos de PostgreSQL, consulte Conector de Debezium para PostgreSQL - Documentación de Debezium.
Si no tiene una secuencia de eventos, cree una.
Habilitación de CDC en la base de datos postgreSQL
En esta sección se usa Azure Database for PostgreSQL como ejemplo.
Siga estos pasos para habilitar CDC en el servidor flexible de Azure Database for PostgreSQL.
En la página de Azure Database for PostgreSQL con servidor flexible de Azure Portal, seleccione Parámetros del servidor en el menú de navegación.
En la página Parámetros del servidor:
- Establezca wal_level en logical.
- Actualice max_worker_processes al menos a 16.
Guarde los cambios y reinicie el servidor.
Confirme que la instancia de servidor flexible de Azure Database for PostgreSQL permite el tráfico de red público.
Conceda permisos de replicación de usuarios administradores mediante la ejecución de la siguiente instrucción SQL. Si desea usar otra cuenta de usuario para conectar la base de datos de PostgreSQL para capturar CDC, asegúrese de que el usuario es el propietario de la tabla.
ALTER ROLE <admin_user_or_table_owner_user> WITH REPLICATION;
Inicio del Asistente para seleccionar un origen de datos
Si aún no ha agregado ningún origen a la secuencia de eventos, seleccione el mosaico Usar origen externo.
Si va a agregar el origen a un elemento Eventstream ya publicado, cambie al modo Editar, seleccione Agregar origen en la cinta de opciones y, a continuación, seleccione Orígenes externos.
En la página Seleccionar un origen de datos, busque y seleccione Conectar en el icono de PostgreSQL DB (CDC).
Configuración y conexión a CDC de PostgreSQL Database
En la página Conectar, seleccione Nueva conexión.
Escriba la información siguiente en la sección Configuración de la conexión.
Servidor: la dirección del servidor de la base de datos de PostgreSQL, por ejemplo, my-pgsql-server.postgres.database.azure.com.
Base de datos: el nombre de la base de datos, por ejemplo, my_database.
Desplácese hacia abajo y, en la sección Credenciales de conexión, siga estos pasos.
Para Nombre de conexión, introduzca un nombre para la conexión.
Para Tipo de autenticación, seleccione Básica.
Nota:
Actualmente, las secuencias de eventos de Fabric solo admiten la autenticación Básica.
Escriba el Nombre de usuario y la Contraseña de la base de datos.
Seleccione Conectar.
Ahora, en la página Conectar, realice estos pasos:
Para Puerto, escriba el número de puerto o deje el valor predeterminado 5432. Si la conexión en la nube seleccionada está configurada en Administrar conexiones y puertas de enlace, asegúrese de que el número de puerto coincide con el establecido allí. Si no coinciden, el número de puerto de la conexión en la nube en Administrar conexiones y puertas de enlace tiene prioridad.
En tabla, seleccione Todas las tablas o Escriba nombres de tabla. Si selecciona este último, especifique tablas con una lista separada por comas de identificadores de tabla completos (
schemaName.tableName
) o expresiones regulares válidas. Por ejemplo:- Use
dbo.test.*
para seleccionar todas las tablas cuyos nombres empiecen pordbo.test
. - Use
dbo\.(test1|test2)
para seleccionardbo.test1
ydbo.test2
. Puede escribir hasta 100 tablas y cada nombre de tabla (incluido el esquema) puede tener hasta 128 caracteres.
Puede mezclar ambos formatos mediante comas. Se pueden escribir hasta 100 tablas, con cada nombre de tabla (incluido el nombre de esquema) limitado a 128 caracteres si se usan identificadores de tabla completos directamente.
- Use
Nombre de ranura (opcional): escriba el nombre de la ranura de descodificación lógica de PostgreSQL que se creó para los cambios de streaming de un complemento determinado para una base de datos o esquema determinado. El servidor usa esta ranura para transmitir eventos al conector de streaming de eventstream. Solo debe contener letras minúsculas, números y caracteres de subrayado.
- Si no se especifica, se usará un GUID para crear la ranura, lo que requiere los permisos de base de datos adecuados.
- Si existe un nombre de ranura especificado, el conector lo usará directamente.
Selecciona Siguiente en la parte inferior de la página.
En la página Revisar y conectar, revise el resumen y, a continuación, seleccione Agregar.
Nota:
El número máximo de orígenes y destinos para una secuencia de eventos es 11.
Visualización de la secuencia de eventos actualizado
Puede ver el origen de CDC de PostgreSQL Database agregado a la secuencia de eventos en el modo Edición.
Para implementar este origen de CDC de base de datos de PostgreSQL recién agregado, seleccione Publicar. Después de completar estos pasos, la fuente de PostgreSQL DB para CDC está disponible para su visualización en la vista en directo.
Contenido relacionado
Otros conectores:
- Flujos de datos de Amazon Kinesis
- Azure Cosmos DB
- Azure Event Hubs
- Azure Service Bus
- Azure IoT Hub
- Captura de datos modificados (CDC) de Azure SQL Database
- Confluent Kafka
- Punto de conexión personalizado
- Google Cloud Pub/Sub
- CDC de base de datos MySQL
- Base de datos CDC de PostgreSQL
- Datos de ejemplo
- Eventos de Azure Blob Storage
- Evento de área de trabajo de Fabric