Données dans les artefacts de transit Dataflow Gen2
Pour améliorer les performances et la fiabilité, Dataflow Gen2 utilise des éléments de transit pour stocker des données intermédiaires pendant la transformation des données. Cet article fournit des informations sur les éléments de transit et la façon de gérer les données dans ces éléments.
Qu’est-ce que les artefacts de transit ?
Les artefacts de transit sont des emplacements de stockage de données intermédiaires utilisés par Dataflow Gen2 pour stocker des données pendant la transformation des données. Ces artefacts sont nommés « DataflowsStagingLakehouse » et « DataflowsStagingWarehouse ». Les artefacts de transit sont utilisés pour stocker des données intermédiaires pendant la transformation des données afin d’améliorer les performances. Ces artefacts sont créés automatiquement lorsque vous créez votre premier flux de données et sont gérés par Dataflow Gen2. Ces artefacts sont masqués de l’utilisateur dans l’espace de travail, mais peuvent être visibles dans d’autres expériences telles que Obtenir des données ou l’explorateur Lakehouse. Nous vous conseillons vivement de ne pas accéder aux données ou les modifier dans les artefacts de transit directement, car cela peut entraîner un comportement inattendu. Le stockage des données par vous-même dans les artefacts de transit n’est pas pris en charge et peut entraîner une perte de données.
Données dans les artefacts de transit
Les artefacts de transit ne sont pas conçus pour un accès direct par les utilisateurs. Dataflow Gen2 gère les données dans les artefacts de transit et garantit que les données sont dans un état cohérent. L’accès direct aux données dans des artefacts de transit n’est pas pris en charge, car il ne peut pas être garanti que les données sont dans un état cohérent. Si vous avez besoin d’accéder aux données dans des artefacts de transit, vous pouvez utiliser le connecteur de flux de données dans Power BI, Excel ou d’autres flux de données.
La suppression de données des artefacts de transit peut être forcée par l’une des actions suivantes :
- Désactiver le transit dans le flux de données et actualiser (après 30 jours, nous exécutons un garbage collector sur les données).
- Supprimer le flux de données (supprime directement les données).
- Supprimer l’espace de travail (supprime directement le StagingLakehouse et le StagingWarehouse).