Extraer datos de modificaciones mediante el origen de CDC
Se aplica a: SQL Server SSIS Integration Runtime en Azure Data Factory
Importante
Los componentes de flujo de CDC, incluida la tarea de control de CDC, el origen de CDC y el divisor de CDC, están en desuso. Para obtener información, consulte el anuncio.
Para agregar y configurar un destino CDC, el paquete ya debe incluir por lo menos una tarea Flujo de datos y una tarea Control CDC.
Para obtener más información acerca del control CDC, vea CDC Control Task.
Para obtener más información acerca del origen de CDC, vea CDC Source.
Para extraer los datos modificados mediante un origen de CDC
En SQL Server Data Tools, abra el proyecto de SQL Server 2019 Integration Services (SSIS) que contiene el paquete que desea.
En el Explorador de soluciones, haga doble clic en el paquete para abrirlo.
Haga clic en la pestaña Flujo de datos y, a continuación, desde el cuadro de herramientas, arrastre el origen de CDC a la superficie de diseño.
Haga doble clic en el origen de CDC.
En el Editor de origen de CDC , en la página Administrador de conexiones , seleccione un administrador de conexiones ADO.NET de la lista o haga clic en Nuevo para crear una nueva conexión. La conexión debe estar en una base de datos de SQL Server que contenga las tablas de modificaciones que se van a leer.
Seleccione Tabla CDC donde desea procesar los cambios.
Seleccione o escriba el nombre de la instancia de captura CDC con la tabla CDC que se va a leer.
Una tabla de origen capturada puede tener una o dos instancias capturadas para controlar que la transición de una definición de tabla a través de los cambios en el esquema se realice sin problemas. Si se define más de una instancia de captura para la tabla de origen que se va a capturar, seleccione aquí la instancia de captura que desee usar. El nombre predeterminado de la instancia de captura para una tabla [esquema].[tabla] es <schema>_<table>, pero los nombres de instancia de captura reales en uso podrían ser distintos. La tabla real de la que se lee es la tabla CDC cdc.<capture-instance>_CT.
Seleccione el modo de procesamiento que mejor controle las necesidades de procesamiento. Las opciones posibles son:
Todos: devuelve los cambios en el intervalo CDC actual sin los valores de Antes de actualización .
Todos con valores antiguos: devuelve los cambios en el intervalo de procesamiento CDC actual, incluidos los valores antiguos (Antes de actualización). Para cada operación de actualización habrá dos filas: una con los valores anteriores a la actualización y otra con los valores posteriores a la actualización.
Neto: devuelve una sola fila de cambios por cada fila de origen modificada en el intervalo de procesamiento de CDC actual. Si una fila de origen se actualizó varias veces, se genera el cambio combinado (por ejemplo, se genera insertar+actualizar como una actualización única y se genera actualizar+eliminar como una eliminación única). Al trabajar en el modo de procesamiento de cambios Neto, es posible dividir los cambios en salidas de eliminar, insertar y actualizar y controlarlos todos en paralelo, ya que la fila de origen única aparece en más de un resultado.
Neto con máscara de actualización: este modo es similar al modo Neto normal, pero también agrega columnas booleanas con el patrón de nombre __$<column-name>_Changed que indica las columnas modificadas en la fila de cambio actual.
Neto con combinación: este modo es similar al modo Neto normal, pero con las operaciones de inserción y actualización combinadas en una sola operación de combinación (UPSERT).
Seleccione la variable de paquete de la cadena de SSIS que mantenga el estado CDC para el contexto CDC actual. Para obtener más información sobre la variable de estado CDC, vea Definir una variable de estado.
Active la casilla Include reprocessing indicator column (Incluir una columna de indicador de reprocesamiento) para crear una columna especial de salida denominada __$reprocessing. Esta columna tiene un valor true cuando el intervalo de procesamiento CDC se superpone con el intervalo de procesamiento inicial (el intervalo de LSN correspondiente al periodo de carga inicial) o cuando un intervalo de procesamiento CDC se vuelve a procesar tras un error en una ejecución anterior. Con esta columna de indicador, el desarrollador de SSIS puede controlar los errores de manera diferente a cuando se vuelven a procesar los cambios (por ejemplo, se pueden omitir acciones como la eliminación de una fila que no existe o una inserción que causó un error en una clave duplicada).
Para más información, consulte CDC Source Custom Properties.
Para actualizar la asignación entre las columnas externas y de salida, haga clic en Columnas y seleccione diferentes columnas en la lista Columna externa .
Opcionalmente, actualice los valores de las columnas de salida eliminando los valores en la lista Columna de salida .
Para configurar la salida de error, haga clic en Salida de error.
Puede hacer clic en Vista previa para ver hasta 200 filas de los datos extraídos por el origen de CDC.
Haga clic en OK.
Consulte también
Editor de origen de CDC (página Administrador de conexiones)
Editor de origen de CDC (página Columnas)
Editor de origen de CDC (página Salida de error)