Udostępnij za pośrednictwem


Moduł 1. Tworzenie potoku za pomocą usługi Data Factory

Czas działania tego modułu wynosi 10 minut, przetwarzając nieprzetworzone dane z magazynu źródłowego do tabeli Bronze w data Lakehouse przy użyciu działania kopiowania w potoku.

Ogólne kroki w module 1 są następujące:

  1. Tworzenie potoku danych.
  2. Użyj działania kopiowania w potoku, aby załadować przykładowe dane do usługi Data Lakehouse.

Tworzenie potoku danych

  1. Wymagane jest konto dzierżawy usługi Microsoft Fabric z aktywną subskrypcją. Utwórz bezpłatne konto.

  2. Upewnij się, że masz obszar roboczy z włączoną usługą Microsoft Fabric: Utwórz obszar roboczy.

  3. Zaloguj się do usługi Power BI.

  4. Wybierz domyślną ikonę usługi Power BI w lewym dolnym rogu ekranu, a następnie wybierz pozycję Fabric.

    Zrzut ekranu przedstawiający wybór środowiska usługi Data Factory.

  5. Wybierz obszar roboczy na karcie Obszary robocze , a następnie wybierz pozycję + Nowy elementi wybierz pozycję Potok danych. Podaj nazwę potoku. Następnie wybierz pozycję Utwórz.

    Zrzut ekranu przedstawiający stronę początkową usługi Data Factory z przyciskiem umożliwiającym utworzenie nowego potoku danych.

    Zrzut ekranu przedstawiający okno dialogowe, aby nadać nowemu potokowi nazwę.

Ładowanie przykładowych danych do usługi Data Lakehouse za pomocą działania kopiowania w potoku

Krok 1. Konfigurowanie działania kopiowania za pomocą asystenta kopiowania.

Wybierz Asystent kopiowania danych, aby otworzyć narzędzie asystenta kopiowania.

Zrzut ekranu przedstawiający wybór działania Kopiuj dane ze strony początkowej nowego potoku.

Krok 2. Konfigurowanie ustawień w asystencie kopiowania.

  1. Okno dialogowe kopiowania danych jest wyświetlane z wyróżnionym pierwszym krokiem, Wybierz źródło danych. Wybierz Przykładowe dane z opcji w górnej części okna dialogowego, a następnie wybierz NYC Taxi - Green.

    Zrzut ekranu przedstawiający wybór danych dotyczących Zielonych Taksówek NYC w narzędziu do kopiowania na karcie Wybieranie źródła danych.

  2. Podgląd źródła danych pojawi się następnie na stronie Połącz ze źródłem danych. Przejrzyj, a następnie wybierz Dalej.

    Zrzut ekranu przedstawiający dane podglądu dla przykładowego zestawu danych NYC Taxi — Green.

  3. W Wybierz miejsce docelowe danych kroku asystenta kopiowania wybierz pozycję Lakehouse, a następnie Dalej.

    Zrzut ekranu przedstawiający wybór celu Lakehouse na zakładce Wybieranie celu danych asystenta kopiowania danych.

  4. Wybierz pozycję Utwórz nową usługę Lakehouse na wyświetlonej stronie konfiguracji miejsca docelowego danych i wprowadź nazwę nowej usługi Lakehouse. Następnie ponownie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający stronę konfiguracji miejsca docelowego danych asystenta kopiowania, wybierając opcję Utwórz nową usługę Lakehouse i podając nazwę usługi Lakehouse.

  5. Skonfiguruj teraz szczegóły dotyczące miejsca docelowego Lakehouse na stronie Wybierz i zamapuj na ścieżkę folderu lub tabeli.. Wybierz Tabele dla folderu głównego , podaj nazwę tabeli, a następnie wybierz opcję Zastąp. Nie zaznaczaj pola wyboru Włącz partycję, które jest wyświetlane po wybraniu akcji Zastąp tabelę.

    Zrzut ekranu przedstawiający kartę Połącz z miejscem docelowym danych asystenta kopiowania danych na etapie Wyboru i mapowania ścieżki folderu lub tabeli.

  6. Na koniec na stronie Sprawdź i zapisz asystenta kopiowania danych przejrzyj konfigurację. Na potrzeby tego samouczka usuń zaznaczenie pola wyboru Rozpocznij transfer danych natychmiast, ponieważ uruchamiamy działanie ręcznie w następnym kroku. Następnie wybierz pozycję OK.

    Zrzut ekranu przedstawiający asystenta kopiowania danych na stronie Przeglądanie i zapisywanie.

Krok 3. Uruchamianie i wyświetlanie wyników działania kopiowania.

  1. Wybierz kartę Uruchom w edytorze pipeline. Następnie wybierz przycisk Uruchom, a następnie, gdy pojawi się monit, wybierz Zapisz i uruchom, aby uruchomić działanie Kopiowania.

    Zrzut ekranu przedstawiający zakładkę Uruchamiania potoku z wyróżnionym przyciskiem Uruchom.

    Zrzut ekranu przedstawiający okno dialogowe Zapisywanie i uruchamianie z wyróżnionym przyciskiem Zapisz i uruchom.

  2. Możesz monitorować przebieg i sprawdzać wyniki na karcie Dane wyjściowe poniżej kanwy potoku. Wybierz przycisk Szczegóły przebiegu (ikona "okularów", która jest wyświetlana po umieszczeniu wskaźnika myszy na uruchomionym przebiegu potoku), aby wyświetlić szczegóły przebiegu.

    Zrzut ekranu przedstawiający przycisk szczegółów uruchomienia na karcie Dane wyjściowe potoku.

  3. Szczegóły przebiegu pokazują 1508 501 wierszy odczytanych i zapisanych.

    Zrzut ekranu przedstawiający szczegóły kopiowania danych dla przebiegu potoku.

  4. Rozwiń sekcję podziału Czas trwania, aby zobaczyć czas trwania każdego etapu działania Kopiowania. Po przejrzeniu szczegółów kopiowania wybierz pozycję Zamknij.

    Zrzut ekranu przedstawiający podział czasu trwania przebiegu działania kopiowania.

W tym pierwszym module do naszego kompleksowego samouczka dotyczącego pierwszej integracji danych przy użyciu usługi Data Factory w usłudze Microsoft Fabric przedstawiono sposób wykonywania następujących czynności:

  • Tworzenie potoku danych.
  • Dodaj zadanie kopiowania do przepływu.
  • Użyj przykładowych danych i utwórz usługę Data Lakehouse, aby przechowywać dane w nowej tabeli.
  • Uruchom potok i wyświetl jego szczegóły i podział czasu trwania.

Przejdź teraz do następnej sekcji, aby utworzyć przepływ danych.