Udostępnij za pośrednictwem


Szybki start: tworzenie pierwszego przepływu danych w celu pobierania i przekształcania danych

Przepływy danych to samoobsługowa, oparta na chmurze technologia przygotowywania danych. W tym artykule utworzysz swój pierwszy przepływ danych, pobierzesz dane dla przepływu danych, a następnie przekształcisz dane i opublikujesz przepływ danych.

Wymagania wstępne

Przed rozpoczęciem wymagane są następujące wymagania wstępne:

Utwórz przepływ danych

W tej sekcji tworzysz pierwszy przepływ danych.

  1. Przejdź do środowiska fabryki danych.

  2. Przejdź do obszaru roboczego usługi Microsoft Fabric.

    Zrzut ekranu przedstawiający okno obszarów roboczych, w którym przechodzisz do obszaru roboczego.

  3. Wybierz pozycję Nowy, a następnie wybierz pozycję Przepływ danych Gen2.

    Zrzut ekranu przedstawiający zaznaczoną opcję Dataflow Gen2.

Pobierz dane

Pobierzmy pewne dane! W tym przykładzie uzyskujesz dane z usługi OData. Aby uzyskać dane w przepływie danych, wykonaj następujące kroki.

  1. W edytorze przepływu danych wybierz pozycję Pobierz dane , a następnie wybierz pozycję Więcej.

    Zrzut ekranu z wybraną opcją Pobierz dane i bardziej podkreśloną w polu listy rozwijanej.

  2. W obszarze Wybierz źródło danych wybierz pozycję Wyświetl więcej.

    Zrzut ekranu przedstawiający pozycję Pobierz źródło danych z bardziej podkreślony widok.

  3. W obszarze Nowe źródło wybierz pozycję Inne>dane OData jako źródło danych.

    Zrzut ekranu przedstawiający pozycję Pobierz źródło danych z podkreślonej kategorii Inne i łącznik OData.

  4. Wprowadź adres URL https://services.odata.org/v4/northwind/northwind.svc/, a następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający źródło danych OData, w którym wprowadzasz adres URL danych.

  5. Wybierz tabele Orders and Customers (Zamówienia i klienci), a następnie wybierz pozycję Utwórz.

    Zrzut ekranu przedstawiający nawigator Power Query z podkreśleniami tabel Customers and Orders (Klienci i Zamówienia).

Aby dowiedzieć się więcej na temat środowiska i funkcji pobierania danych, zobacz Uzyskiwanie przeglądu danych.

Stosowanie przekształceń i publikowanie

Załadowałeś swoje dane do pierwszego przepływu danych właśnie teraz. Gratulacje! Teraz nadszedł czas, aby zastosować kilka przekształceń, aby przenieść te dane do żądanego kształtu.

To zadanie należy wykonać z poziomu edytora Power Query. Szczegółowe omówienie edytora Power Query można znaleźć w sekcji Interfejs użytkownika dodatku Power Query.

Wykonaj następujące kroki, aby zastosować przekształcenia i opublikować:

  1. Upewnij się, że narzędzia profilowania danych są włączone, przechodząc do pozycji Opcje globalne opcji>> strony głównej.

    Zrzut ekranu przedstawiający opcje globalne z zaznaczonymi opcjami profilu kolumny.

    Upewnij się również, że widok diagramu został włączony przy użyciu opcji na karcie Widok na wstążce edytora Power Query lub wybierając ikonę widoku diagramu w prawym dolnym rogu okna Power Query.

    Zrzut ekranu przedstawiający ogólny wygląd widoku diagramu dodatku Power Query.

  2. W tabeli Orders (Zamówienia) obliczana jest łączna liczba zamówień na klienta. Aby osiągnąć ten cel, wybierz kolumnę CustomerID w podglądzie danych, a następnie wybierz pozycję Grupuj według na karcie Przekształć na wstążce.

    Zrzut ekranu przedstawiający wybraną tabelę Orders (Zamówienia) i Grupuj według na karcie Przekształć.

  3. Liczbę wierszy należy wykonać jako agregację w obszarze Grupuj według. Aby dowiedzieć się więcej na temat funkcji Grupuj według, zobacz Grupowanie lub podsumowywanie wierszy.

    Zrzut ekranu przedstawiający grupowanie według z wybraną operacją Zlicz wiersze.

  4. Po zgrupowaniu danych w tabeli Orders (Zamówienia) uzyskamy dwukolumny tabelę z kolumnami CustomerID (Identyfikator klienta) i Count (Liczba ).

    Zrzut ekranu przedstawiający dwie kolumny tabeli.

  5. Następnie chcesz połączyć dane z tabeli Customers (Klienci) z tabelą Count of Orders per customer (Liczba zamówień na klienta). Aby połączyć dane, wybierz zapytanie Klienci w widoku diagramu i użyj menu "⋮", aby uzyskać dostęp do zapytań scalania jako nowej transformacji.

    Zrzut ekranu przedstawiający edytor przepływu danych z wielokropkiem pionowym tabeli Customers i zapytaniami scalania jako nowe podkreślone.

  6. Skonfiguruj operację scalania, jak pokazano na poniższym zrzucie ekranu, wybierając pozycję CustomerID jako pasującą kolumnę w obu tabelach. Następnie wybierz Ok.

    Zrzut ekranu przedstawiający okno Scalanie.

    Zrzut ekranu przedstawiający okno Scalanie z tabelą Po lewej stronie dla scalania ustawioną na tabelę Customers (Klienci) i tabelą Right (Prawa) dla scalania ustawioną na tabelę Orders (Zamówienia). Kolumna CustomerID jest wybierana zarówno dla tabel Customers, jak i Orders. Ponadto dla opcji Rodzaj sprzężenia jest ustawiona wartość Lewa zewnętrzna. Wszystkie inne opcje są ustawione na ich wartość domyślną.

  7. Podczas wykonywania zapytań scalania jako nowej operacji uzyskujesz nowe zapytanie ze wszystkimi kolumnami z tabeli Customers i jedną kolumną z zagnieżdżonymi danymi z tabeli Orders (Zamówienia).

    Zrzut ekranu edytora przepływów danych z nowym zapytaniem scalania dodanym z prawej strony tabel Klienci i Zamówienia.

  8. W tym przykładzie interesuje Cię tylko podzbiór kolumn w tabeli Customers. Te kolumny są wybierane przy użyciu widoku schematu. Włącz widok schematu w przycisku przełącznika w prawym dolnym rogu edytora przepływów danych.

    Zrzut ekranu edytora przepływów danych z przyciskiem widoku schematu, który został podkreślony w prawym dolnym rogu.

  9. Widok schematu zapewnia skoncentrowany widok na informacje o schemacie tabeli, w tym nazwy kolumn i typy danych. Widok schematu zawiera zestaw narzędzi schematu dostępnych za pomocą kontekstowej karty wstążki. W tym scenariuszu wybierasz kolumny CustomerID, CompanyName i Orders (2), a następnie wybierz przycisk Usuń kolumny, a następnie wybierz pozycję Usuń inne kolumny na karcie Narzędzia schematu.

    Zrzut ekranu przedstawiający widok schematu przedstawiający wszystkie dostępne nazwy kolumn z podkreśleniami Kolumn CustomerID, CompanyName i Orders (2).

    Zrzut ekranu przedstawiający menu narzędzi schematu z wyróżnieniem Usuń inne kolumny.

  10. Kolumna Orders (2) zawiera zagnieżdżone informacje wynikające z operacji scalania wykonanej kilka kroków temu. Teraz wróć do widoku danych, wybierając przycisk Pokaż widok danych obok przycisku Pokaż widok schematu w prawym dolnym rogu interfejsu użytkownika. Następnie użyj przekształcenia Rozwiń kolumnę w nagłówku kolumny Orders (2), aby wybrać kolumnę Count (Liczba ).

    Zrzut ekranu przedstawiający korzystanie z widoku danych.

  11. Jako ostateczna operacja chcesz sklasyfikować klientów w oparciu o ich liczbę zamówień. Wybierz kolumnę Liczba , a następnie wybierz przycisk Kolumna rangi na karcie Dodaj kolumnę na wstążce.

    Zrzut ekranu edytora przepływów danych z wybraną kolumną Liczba.

  12. Zachowaj ustawienia domyślne w kolumnie Ranga. Następnie wybierz przycisk OK , aby zastosować tę transformację.

    Zrzut ekranu przedstawiający okno Ranga z wyświetlonymi wszystkimi ustawieniami domyślnymi.

  13. Teraz zmień nazwę wynikowego zapytania jako Sklasyfikowani klienci przy użyciu okienka Ustawienia zapytania po prawej stronie ekranu.

    Zrzut ekranu edytora przepływów danych z nazwą Sklasyfikowani klienci podkreślony we właściwościach ustawień zapytania.

  14. Po zakończeniu przekształcania i łączenia danych możesz skonfigurować jego ustawienia wyjściowe. Wybierz pozycję Wybierz miejsce docelowe danych w dolnej części okienka Ustawienia zapytania.

    Zrzut ekranu edytora przepływów danych z zaznaczoną lokalizacją wybranego miejsca docelowego danych.

  15. W tym kroku możesz skonfigurować dane wyjściowe w usłudze Lakehouse, jeśli masz dostępną, lub pominąć ten krok, jeśli nie. W tym środowisku możesz skonfigurować docelowy magazyn lakehouse i tabelę dla wyników zapytania, oprócz metody aktualizacji (Append or Replace).

    Zrzut ekranu przedstawiający okno Połącz z miejscem docelowym danych z wybraną usługą Lakehouse.

    Zrzut ekranu przedstawiający okno Wybieranie ustawień docelowych.

  16. Przepływ danych jest teraz gotowy do opublikowania. Przejrzyj zapytania w widoku diagramu, a następnie wybierz pozycję Publikuj.

    Zrzut ekranu edytora przepływów danych z przyciskiem Publikuj w prawym dolnym rogu.

    Teraz wrócisz do obszaru roboczego. Ikona pokrętła obok nazwy przepływu danych wskazuje, że publikowanie jest w toku. Po zakończeniu publikowania przepływ danych jest gotowy do odświeżenia.

    Ważne

    Po utworzeniu pierwszego przepływu danych Gen2 w obszarze roboczym elementy usługi Lakehouse i Warehouse są aprowizowane wraz z powiązanymi punktami końcowymi i semantycznymi modelami analizy SQL. Te elementy są współużytkowane przez wszystkie przepływy danych w obszarze roboczym i są wymagane, aby przepływ danych Gen2 działał, nie powinien być usuwany i nie jest przeznaczony do bezpośredniego użycia przez użytkowników. Elementy są szczegółami implementacji usługi Dataflow Gen2. Elementy nie są widoczne w obszarze roboczym, ale mogą być dostępne w innych środowiskach, takich jak notes, punkt końcowy analizy SQL, usługa Lakehouse i magazyn. Elementy można rozpoznać według ich prefiksu w nazwie. Prefiks elementów to "Przepływy danychStaging".

  17. W obszarze roboczym wybierz ikonę Zaplanuj odświeżanie .

    Zrzut ekranu przedstawiający obszar roboczy z podkreślonej ikoną zaplanowanego odświeżania.

  18. Włącz zaplanowane odświeżanie, wybierz pozycję Dodaj kolejny raz i skonfiguruj odświeżanie, jak pokazano na poniższym zrzucie ekranu.

    Zrzut ekranu przedstawiający sposób wybierania innego czasu.

    Zrzut ekranu przedstawiający opcje zaplanowanego odświeżania z włączonym zaplanowanym odświeżaniem, częstotliwością odświeżania ustawioną na wartość Codziennie, strefą czasową ustawioną na uniwersalny czas koordynowany oraz czasem ustawionym na 4:00. Przycisk włączone, wybór Dodaj inny czas, właściciel przepływu danych i przycisk Zastosuj są podkreślone.

Czyszczenie zasobów

Jeśli nie zamierzasz nadal korzystać z tego przepływu danych, usuń przepływ danych, wykonując następujące czynności:

  1. Przejdź do obszaru roboczego usługi Microsoft Fabric.

    Zrzut ekranu przedstawiający okno obszarów roboczych, w którym przechodzisz do obszaru roboczego.

  2. Wybierz wielokropek pionowy obok nazwy przepływu danych, a następnie wybierz pozycję Usuń.

    Zrzut ekranu z trzema pionowymi kropkami i opcją usuwania z wyświetlonego menu rozwijanego.

  3. Wybierz pozycję Usuń , aby potwierdzić usunięcie przepływu danych.

    Zrzut ekranu przedstawiający okno Usuwanie przepływu danych z podkreśleniem przycisku Usuń.

W przepływie danych w tym przykładzie pokazano, jak ładować i przekształcać dane w przepływie danych Gen2. W tym samouczku omówiono:

  • Utwórz przepływ danych Gen2.
  • Przekształcanie danych.
  • Skonfiguruj ustawienia docelowe dla przekształconych danych.
  • Uruchamianie i planowanie potoku danych.

Przejdź do następnego artykułu, aby dowiedzieć się, jak utworzyć pierwszy potok danych.