Udostępnij za pośrednictwem


Obsługa integracji/ciągłego wdrażania i ciągłego wdrażania w usłudze Dataflow Gen2 (wersja zapoznawcza)

Usługa Dataflow Gen2 obsługuje teraz ciągłą integrację/ciągłe wdrażanie (CI/CD) i integrację z usługą Git. Ta funkcja umożliwia tworzenie, edytowanie i zarządzanie przepływami danych w repozytorium Git połączonym z obszarem roboczym sieci szkieletowej. Ponadto możesz użyć funkcji potoków wdrażania, aby zautomatyzować wdrażanie przepływów danych z obszaru roboczego do innych obszarów roboczych. W tym artykule opisano sposób używania usługi Dataflow Gen2 z ciągłą integracją/ciągłym wdrażaniem i integracją usługi Git w usłudze Fabric Data Factory.

Notatka

Wydanie wsparcia dla ciągłej integracji/ciągłego wdrażania oraz integracji z Git zostało przełożone na styczeń, aby zapewnić jakość wydania i uniknąć wpływu na istniejące operacje. Przepraszamy za wszelkie niedogodności i doceniamy Twoją wiedzę.

Nowe funkcje

Usługa Dataflow Gen2 (wersja zapoznawcza ciągłej integracji/ciągłego wdrażania) umożliwia teraz:

  • Korzystanie z obsługi integracji z usługą Git dla usługi Dataflow Gen2.
  • Funkcja potoków wdrażania umożliwia zautomatyzowanie wdrażania przepływów danych z obszaru roboczego do innych obszarów roboczych.
  • Użyj ustawień sieci szkieletowej i harmonogramu, aby odświeżyć i edytować ustawienia przepływu danych Gen2.
  • Utwórz przepływ danych Gen2 bezpośrednio w folderze obszaru roboczego.

Wymagania wstępne

Aby rozpocząć pracę, należy spełnić następujące wymagania wstępne:

  • Posiadanie konta dzierżawy usługi Microsoft Fabric z aktywną subskrypcją. Utwórz bezpłatne konto.
  • Upewnij się, że masz obszar roboczy z włączoną usługą Microsoft Fabric.
  • Aby korzystać z integracji z usługą Git, upewnij się, że jest ona włączona dla obszaru roboczego. Aby dowiedzieć się więcej na temat włączania integracji z usługą Git, zobacz Wprowadzenie do integracji z usługą Git.

Tworzenie przepływu danych Gen2 z obsługą ciągłej integracji/ciągłego wdrażania i usługi Git

Aby utworzyć przepływ danych Gen2 z obsługą ciągłej integracji/ciągłego wdrażania i usługi Git, wykonaj następujące kroki:

  1. W obszarze roboczym Sieć szkieletowa wybierz pozycję Utwórz nowy element , a następnie wybierz pozycję Dataflow Gen2.

    Zrzut ekranu przedstawiający okno Nowy element z podkreśleniem elementu Dataflow Gen2.

  2. Nadaj przepływowi danych nazwę i włącz integrację z usługą Git. Następnie wybierz Utwórz.

    Zrzut ekranu przedstawiający okno Nowy przepływ danych Gen2 z ustawionym zestawem nazw przepływu danych i podkreśloną i wybraną integracją usługi Git.

    Przepływ danych zostanie utworzony i nastąpi przekierowanie do kanwy tworzenia przepływu danych. Teraz możesz rozpocząć tworzenie przepływu danych.

  3. Po zakończeniu wybierz pozycję Zapisz i uruchom.

    Zrzut ekranu edytora Power Query z podkreślony przyciskiem Zapisz i uruchom.

  4. Po opublikowaniu przepływ danych ma stan niezatwierdzonych.

    Zrzut ekranu przedstawiający zapisany przepływ danych Gen2 ze stanem wyświetlanym jako niezatwierdzony.

  5. Aby zatwierdzić przepływ danych w repozytorium Git, wybierz ikonę kontroli źródła w prawym górnym rogu widoku obszaru roboczego.

    Zrzut ekranu przedstawiający przycisk Kontrola źródła.

  6. Wybierz wszystkie zmiany, które chcesz zatwierdzić, a następnie wybierz pozycję Zatwierdź.

    Zrzut ekranu przedstawiający okno Kontrola źródła z zaznaczonym przepływem danych i przyciskiem Zatwierdź.

Masz teraz przepływ danych Gen2 z obsługą ciągłej integracji/ciągłego wdrażania i usługi Git. Zalecamy stosowanie najlepszych rozwiązań dotyczących pracy z ciągłą integracją/ciągłym wdrażaniem i integracją z usługą Git w usłudze Fabric opisanym w artykule Scenariusz 2 — Opracowywanie przy użyciu innego samouczka dotyczącego obszaru roboczego .

Odświeżanie przepływu danych Gen2 lub planowanie odświeżania

Przepływ danych Gen2 można odświeżyć przy użyciu ciągłej integracji/ciągłego wdrażania i obsługi usługi Git na dwa sposoby — ręcznie lub przez zaplanowanie odświeżania. W poniższych sekcjach opisano sposób odświeżania przepływu danych Gen2 przy użyciu ciągłej integracji/ciągłego wdrażania i obsługi usługi Git.

Odśwież teraz

  1. W obszarze roboczym sieci szkieletowej wybierz ikonę wielokropka więcej opcji obok przepływu danych, który chcesz odświeżyć.

  2. Wybierz pozycję Odśwież teraz.

    Zrzut ekranu przedstawiający menu rozwijane więcej opcji z podkreślonymi opcjami Odśwież teraz.

Planowanie odświeżania

Jeśli przepływ danych musi być odświeżany w regularnych odstępach czasu, możesz zaplanować odświeżanie przy użyciu harmonogramu sieci szkieletowej.

  1. W obszarze roboczym Sieć szkieletowa wybierz ikonę wielokropka więcej opcji obok przepływu danych, który chcesz odświeżyć.

  2. Wybierz Harmonogram.

    Zrzut ekranu przedstawiający menu rozwijane więcej opcji z zaznaczoną opcją Harmonogram.

  3. Na stronie harmonogramu można ustawić częstotliwość odświeżania oraz godzinę rozpoczęcia i godziny zakończenia, po której można zastosować zmiany.

    Zrzut ekranu ustawień przepływu danych z wybraną kartą Harmonogram i przyciskiem Odśwież.

  4. Aby rozpocząć odświeżanie teraz, wybierz przycisk Odśwież .

Historia i ustawienia odświeżania

Aby wyświetlić historię odświeżania przepływu danych, możesz wybrać kartę Historia odświeżania w menu rozwijanym lub przejść do centrum monitora i wybrać przepływ danych, dla którego chcesz wyświetlić historię odświeżania.

Ustawienia dla usługi Dataflow Gen2 z ciągłą integracja/ciągłe wdrażanie

Uzyskiwanie dostępu do ustawień nowego przepływu danych Gen2 przy użyciu ciągłej integracji/ciągłego wdrażania i obsługi usługi Git jest podobne do każdego innego elementu sieci szkieletowej. Aby uzyskać dostęp do ustawień, wybierz ikonę wielokropka więcej opcji obok przepływu danych i wybierając ustawienia.

Ograniczenia i znane problemy

Chociaż usługa Dataflow Gen2 z ciągłą integracją/ciągłym wdrażaniem i obsługą Git oferuje zaawansowany zestaw funkcji do współpracy w przedsiębiorstwach, wymagało to od nas przebudowy zaplecza do architektury tkaniny. Oznacza to, że niektóre funkcje nie są jeszcze dostępne lub mają ograniczenia. Aktywnie pracujemy nad ulepszeniem środowiska i zaktualizujemy ten artykuł w miarę dodawania nowych funkcji.

  • Przejściowe artefakty są widoczne w niektórych środowiskach, takich jak interfejs użytkownika ALM. Przejściowe artefakty będą ukryte we wszystkich środowiskach w przyszłości.
  • Po usunięciu ostatniego przepływu danych Gen2 z obsługą ciągłej integracji/ciągłego wdrażania i usługi Git przejściowe artefakty staną się widoczne w obszarze roboczym i są bezpieczne do usunięcia przez użytkownika.
  • Niektóre środowiska wspominają o obsłudze interfejsów API REST, ale te interfejsy API nie są jeszcze dostępne. Cała usługa Dataflow Gen2 z ciągłą integracji/ciągłego wdrażania i obsługa usługi Git będzie obsługiwać publiczny interfejs API sieci szkieletowej w przyszłości.
  • Organizowanie odświeżania przepływu danych Gen2 przy użyciu ciągłej integracji/ciągłego wdrażania i obsługi usługi Git nie jest możliwe w potokach danych sieci szkieletowej.
  • Widok obszaru roboczego nie jest wyświetlany, jeśli trwa odświeżanie przepływu danych.
  • Rozwiązanie Copilot dla usługi Dataflow Gen2 z ciągłą integracji/ciągłego wdrażania i obsługą usługi Git nie jest jeszcze dostępne.
  • Połączenia bramy sieci wirtualnej nie są jeszcze obsługiwane w środowisku tworzenia przepływu danych.
  • Nie można wyeksportować Dataflow.json z menu obszaru roboczego. Obejścia, które umożliwiają eksportowanie przepływu danych:
    • Użyj publicznego interfejsu API sieci szkieletowej, aby uzyskać Dataflow.json.
    • Użyj funkcji eksportowania szablonu dodatku Power Query, aby wyeksportować definicję przepływu danych.
    • Użyj eksploratora OneLake do obszaru roboczego, aby pobrać definicję przepływu danych.
  • Obsługa ciągłej integracji/ciągłego wdrażania w usłudze Dataflow Gen2 i git nie obsługuje funkcji przejęcia własności w obszarze roboczym Sieć szkieletowa. W związku z tym tylko twórca przepływu danych może edytować przepływ danych. Jeśli chcesz współpracować w przepływie danych, możesz użyć gałęzi w repozytorium Git i utworzyć żądanie ściągnięcia w celu scalenia zmian. Aby uzyskać więcej informacji, zobacz Scenariusz 2 — Programowanie przy użyciu innego obszaru roboczego.
  • Podczas rozgałęziania do innego obszaru roboczego odświeżanie przepływu danych Gen2 może zakończyć się niepowodzeniem z komunikatem, że nie można odnaleźć przejściowego magazynu lakehouse. W takim przypadku utwórz nowy przepływ danych Gen2 z obsługą ciągłej integracji/ciągłego wdrażania i usługi Git w obszarze roboczym, aby wyzwolić tworzenie przejściowego magazynu typu lakehouse. Następnie wszystkie inne przepływy danych w obszarze roboczym powinny zacząć działać ponownie.
  • Podczas tworzenia nowego elementu w obszarze roboczym może zostać wyświetlony element "Przepływ danych Gen2 (CI/CD, wersja zapoznawcza)". Zignoruj ten i postępuj zgodnie z instrukcjami opisanymi w tym artykule. Może upłynąć trochę czasu, dopóki region nie wyświetli pola wyboru umożliwiającego włączenie ciągłej integracji/ciągłego wdrażania i obsługi usługi Git.
  • Opcja Szybkie kopiowanie może nie być domyślnie włączona w przepływie danych. Można to włączyć przy użyciu ustawień przepływu danych.
  • Połączenia korzystające z lokalnej bramy danych są obecnie przyczyną problemów podczas odświeżania przepływu danych. Zalecamy użycie innej metody pobierania danych z lokalnych źródeł danych do platformy.

Zobowiązujemy się do ciągłego ulepszania Dataflow Gen2 dzięki obsłudze CI/CD i Git, i doceniamy waszą cierpliwość podczas pracy nad tymi usprawnieniami.