Dados em artefatos de preparo do Fluxo de Dados Gen2
Para aprimorar o desempenho e a confiabilidade, o Fluxo de Dados Gen2 usa itens de preparo para armazenar dados intermediários durante a transformação de dados. Este artigo fornece informações sobre o que são itens de preparo e como gerenciar os dados que eles contêm.
O que são artefatos de preparo?
Os artefatos de preparo são locais de armazenamento de dados intermediários usados pelo Fluxo de Dados Gen2 para armazenar dados durante a transformação de dados. Esses artefatos são conhecidos pelos nomes “DataflowsStagingLakehouse” e “DataflowsStagingWarehouse”. Os artefatos de preparo são usados para armazenar dados intermediários durante a transformação de dados com a finalidade de melhorar o desempenho. Esses artefatos são criados automaticamente quando você cria seu primeiro fluxo de dados e são gerenciados pelo Fluxo de Dados Gen2. Esses artefatos permanecem ocultos para o usuário no espaço de trabalho, mas podem ser visíveis em outras áreas, como Obter Dados ou no explorador de Lakehouse. Nós recomendamos fortemente não acessar ou modificar diretamente os dados nos artefatos de preparo, pois isso pode causar comportamentos imprevistos. Além disso, não há suporte para o armazenamento de dados manual nos artefatos de preparo e isso pode resultar em perda de dados.
Dados em artefatos de preparo
Os artefatos de preparo não são projetados para acesso direto por parte dos usuários. O Fluxo de Dados Gen2 gerencia os dados nos artefatos de preparo e garante que os dados estejam em um estado com consistência. Não há suporte para o acesso direto aos dados em artefatos de preparo, pois não é possível garantir que os dados estejam em um estado com consistência. Se você precisar obter acesso aos dados nos artefatos de preparo, poderá usar o conector de fluxo de dados no Power BI, no Excel ou em outros fluxos de dados.
Para forçar a remoção de dados dos artefatos de preparo, você pode realizar uma das seguintes ações:
- Desabilitar o preparo no fluxo de dados e renovar (após 30 dias, realizamos a coleta de dados não utilizados).
- Excluir o fluxo de dados (remove diretamente os dados).
- Excluir o espaço de trabalho (exclui diretamente o StagingLakehouse e o StagingWarehouse).