Depuración del flujo de datos de asignación
Durante la creación de flujos de datos de asignación, puede ver de forma interactiva cómo se ejecutan las transformaciones de datos para poder depurarlas. Para usar esta funcionalidad, primero es necesario activar la característica "Depuración del flujo de datos".
Al hacer clic en Depurar, se aprovisionarán los clústeres de Spark necesarios para interactuar con las transformaciones de flujo de datos de asignación. Al activar la depuración, se le pedirá que seleccione el entorno de ejecución de integración que debe usar en el entorno. Si selecciona AutoResolveIntegrationRuntime, se creará un clúster con ocho núcleos que estará disponible con un valor de período de vida de 60 minutos.
Nota:
Normalmente, el clúster tarda unos 5-7 minutos en activarse. Con este modo activado y los clústeres de Spark en ejecución, puede crear el flujo de datos paso a paso y ver los datos a medida que se ejecutan en cada fase de transformación.
Hay disponible una pestaña de vista previa de datos en el modo de depuración que le permitirá ver los datos en cada fase de la canalización. Puede ver los datos después de cada transformación. El controlador de vista previa de datos también le permite realizar acciones en los datos, como examinar estadísticas descriptivas de los datos o modificarlos.
Por último, puede usar la configuración de depuración para controlar el número de filas que se devuelven en el controlador de vista previa de datos.
Nota:
Se recomienda limitar el número de filas que se devuelven lo suficiente como para poder confirmar que los datos son correctos. Cuanto mayor sea el conjunto de datos, más tiempo se tardará en devolver los resultados. También puede usar la configuración de depuración para especificar los valores de parámetro que se deben utilizar durante la ejecución de la canalización.