Compartir vía


Datos en artefactos de almacenamiento provisional de Dataflow Gen2

Para mejorar el rendimiento y la confiabilidad, Dataflow Gen2 usa elementos de almacenamiento provisional para almacenar datos intermedios durante la transformación de datos. En este artículo se proporciona información sobre qué son los elementos de almacenamiento provisional y cómo controlar los datos dentro de ellos.

¿Qué son los artefactos de almacenamiento provisional?

Los artefactos de almacenamiento provisional son ubicaciones de almacenamiento de datos intermedias que usa Dataflow Gen2 para almacenar datos durante la transformación de datos. Estos artefactos se llaman "DataflowsStagingLakehouse" y "DataflowsStagingWarehouse". Los artefactos de almacenamiento provisional se usan para almacenar datos intermedios durante la transformación de datos a fin de mejorar el rendimiento. Estos artefactos se crean automáticamente al crear el primer flujo de datos y se administran mediante Dataflow Gen2. Estos artefactos están ocultos del usuario en el área de trabajo, pero podrían estar visibles en otras experiencias como Obtener datos o el explorador de Lakehouse. Se recomienda encarecidamente no acceder a los datos ni modificarlos directamente en los artefactos de almacenamiento provisional, ya que puede provocar un comportamiento inesperado. Tampoco se admite el almacenamiento de datos en los artefactos de almacenamiento provisional; podría provocar la pérdida de datos.

Datos en artefactos de almacenamiento provisional

Los artefactos de almacenamiento provisional no están diseñados para el acceso directo de los usuarios. Dataflow Gen2 administra los datos en los artefactos de almacenamiento provisional y garantiza que los datos están en un estado coherente. No se admite el acceso a los datos en artefactos de almacenamiento provisional directamente, ya que no se puede garantizar que los datos estén en un estado coherente. Si necesita acceder a los datos en artefactos de almacenamiento provisional, puede usar el conector de flujo de datos en Power BI, Excel u otros flujos de datos.

La eliminación de datos de los artefactos de almacenamiento provisional se puede forzar mediante una de las siguientes acciones:

  • Deshabilitar el almacenamiento provisional en el flujo de datos y la actualización (después de 30 días se hace una recolección de elementos no utilizados de los datos).
  • Eliminar el flujo de datos (quita directamente los datos).
  • Eliminar el área de trabajo (elimina directamente StagingLakehouse y StagingWarehouse).