Udostępnij za pośrednictwem


Dane w artefaktach przejściowych przepływu danych Gen2

Aby zwiększyć wydajność i niezawodność, przepływ danych Gen2 używa elementów przejściowych do przechowywania danych pośrednich podczas przekształcania danych. Ten artykuł zawiera informacje na temat elementów przejściowych i sposobu ich obsługi.

Co to są przejściowe artefakty?

Przejściowe artefakty to pośrednie lokalizacje magazynu danych używane przez usługę Dataflow Gen2 do przechowywania danych podczas przekształcania danych. Te artefakty są objęte nazwami "DataflowsStagingLakehouse" i "DataflowsStagingWarehouse". Przejściowe artefakty są używane do przechowywania danych pośrednich podczas przekształcania danych w celu zwiększenia wydajności. Te artefakty są tworzone automatycznie podczas tworzenia pierwszego przepływu danych i są zarządzane przez usługę Dataflow Gen2. Te artefakty są ukryte przed użytkownikiem w obszarze roboczym, ale mogą być widoczne w innych środowiskach, takich jak Pobieranie danych lub Eksplorator usługi Lakehouse. Zdecydowanie zalecamy, aby nie uzyskiwać dostępu do danych ani modyfikować ich bezpośrednio w artefaktach przejściowych, ponieważ może to prowadzić do nieoczekiwanego zachowania. Przechowywanie danych samodzielnie w tymczasowych artefaktach nie jest obsługiwane i może spowodować utratę danych.

Dane w artefaktach przejściowych

Artefakty przejściowe nie są przeznaczone do bezpośredniego dostępu użytkowników. Przepływ danych Gen2 zarządza danymi w artefaktach przejściowych i zapewnia, że dane są w stanie spójnym. Uzyskiwanie dostępu do danych w artefaktach przejściowych bezpośrednio nie jest obsługiwane, ponieważ nie można zagwarantować, że dane są w stanie spójnym. Jeśli potrzebujesz dostępu do danych w artefaktach przejściowych, możesz użyć łącznika przepływu danych w usłudze Power BI, programie Excel lub innych przepływach danych.

Usunięcie danych z tymczasowych artefaktów może być wymuszane przez jedną z następujących akcji:

  • Wyłącz przemieszczanie w przepływie danych i odświeżenie (po upływie 30 dni odśmiecamy dane).
  • Usuń przepływ danych (bezpośrednio usuwa dane).
  • Usuń obszar roboczy (bezpośrednio usuwa stagingLakehouse i StagingWarehouse).