Moduł 1. Tworzenie potoku za pomocą usługi Data Factory
Ten moduł trwa 10 minut, pozyskiwanie danych pierwotnych z magazynu źródłowego do tabeli Bronze usługi Data Lakehouse przy użyciu działanie Kopiuj w potoku.
Ogólne kroki w module 1 są następujące:
- Tworzenie potoku danych.
- Użyj działania kopiowania w potoku, aby załadować przykładowe dane do usługi Data Lakehouse.
Tworzenie potoku danych
Wymagane jest konto dzierżawy usługi Microsoft Fabric z aktywną subskrypcją. Utwórz bezpłatne konto.
Upewnij się, że masz obszar roboczy z włączoną usługą Microsoft Fabric: tworzenie obszaru roboczego.
Zaloguj się w Power BI.
Wybierz domyślną ikonę usługi Power BI w lewym dolnym rogu ekranu i przejdź do środowiska usługi Data Factory .
Wybierz pozycję Potok danych i podaj nazwę potoku. Następnie wybierz Utwórz.
Ładowanie przykładowych danych do usługi Data Lakehouse przy użyciu działanie Kopiuj w potoku
Krok 1. Konfigurowanie działania kopiowania za pomocą asystenta kopiowania.
Wybierz pozycję Kopiuj dane , aby otworzyć narzędzie asystenta kopiowania.
Krok 2. Konfigurowanie ustawień w asystencie kopiowania.
Zostanie wyświetlone okno dialogowe Kopiowanie danych z wyróżnionym pierwszym krokiem Wybierz źródło danych. W razie potrzeby przewiń w dół do sekcji Źródła danych i wybierz typ źródła danych usługi Azure Blob Storage . Następnie kliknij przycisk Dalej.
W następnym kroku wybierz pozycję Utwórz nowe połączenie , a następnie podaj adres URL magazynu obiektów blob hostujących przykładowe dane podane w tym samouczku pod adresem
https://nyctaxisample.blob.core.windows.net/sample
. Rodzaj uwierzytelniania to Anonimowe. Po podaniu adresu URL wybierz pozycję Dalej .Zostanie wyświetlony krok Połączenie źródła danych i początkowo zostanie wyświetlony błąd Nie można wyświetlić listy plików, ponieważ uprawnienia zostały przyznane tylko do folderu przykładowego w magazynie obiektów blob. Podaj nazwę folderu, przykład i wybierz pozycję Ponów próbę.
Uwaga
W folderze magazynu obiektów blob uwzględniana jest wielkość liter i powinna znajdować się we wszystkich małych literach.
Zostanie wyświetlona przeglądarka usługi Blob Storage. Wybierz plik NYC-Taxi-Green-2015-01.parquet i poczekaj na wyświetlenie podglądu danych. Następnie kliknij przycisk Dalej.
W kroku Wybieranie miejsca docelowego danych asystenta kopiowania wybierz pozycję Lakehouse, a następnie pozycję Dalej.
Wybierz pozycję Utwórz nową usługę Lakehouse na wyświetlonej stronie konfiguracji miejsca docelowego danych i wprowadź nazwę nowej usługi Lakehouse. Następnie ponownie wybierz pozycję Dalej .
Teraz skonfiguruj szczegóły miejsca docelowego usługi Lakehouse na stronie Wybierz i zamapuj na ścieżkę folderu lub tabelę. Wybierz pozycję Tabele dla folderu głównego, podaj nazwę tabeli i wybierz akcję Zastąp . Nie zaznaczaj pola wyboru Włącz partycję, które jest wyświetlane po wybraniu akcji Zastąp tabelę.
Na koniec na stronie Przeglądanie i zapisywanie asystenta kopiowania danych przejrzyj konfigurację. W tym samouczku usuń zaznaczenie pola wyboru Rozpocznij transfer danych natychmiast , ponieważ uruchamiamy działanie ręcznie w następnym kroku. Następnie wybierz opcję OK.
Krok 3. Uruchamianie i wyświetlanie wyników działanie Kopiuj.
Wybierz kartę Uruchom w edytorze potoków. Następnie wybierz przycisk Uruchom, a następnie pozycję Zapisz i uruchom w wierszu polecenia, aby uruchomić działanie Kopiuj.
Możesz monitorować przebieg i sprawdzać wyniki na karcie Dane wyjściowe poniżej kanwy potoku. Wybierz przycisk Szczegóły przebiegu (ikona "okularów", która jest wyświetlana po umieszczeniu wskaźnika myszy na uruchomionym przebiegu potoku), aby wyświetlić szczegóły przebiegu.
Szczegóły przebiegu pokazują 1508 501 wierszy odczytanych i zapisanych.
Rozwiń sekcję Podział czasu trwania, aby zobaczyć czas trwania każdego etapu działanie Kopiuj. Po przejrzeniu szczegółów kopiowania wybierz pozycję Zamknij.
Powiązana zawartość
W tym pierwszym module do naszego kompleksowego samouczka dotyczącego pierwszej integracji danych przy użyciu usługi Data Factory w usłudze Microsoft Fabric przedstawiono sposób wykonywania następujących czynności:
- Tworzenie potoku danych.
- Dodaj działanie Kopiuj do potoku.
- Użyj przykładowych danych i utwórz usługę Data Lakehouse, aby przechowywać dane w nowej tabeli.
- Uruchom potok i wyświetl jego szczegóły i podział czasu trwania.
Przejdź teraz do następnej sekcji, aby utworzyć przepływ danych.