Czyszczenie i przekształcanie danych za pomocą Power Query Edytora
Teraz, po nawiązaniu połączenia ze źródłem danych przy użyciu Microsoft Power BI aplikacji Desktop, musimy dostosować dane do naszych potrzeb. Czasami dostosowanie oznacza przekształcenie danych, na przykład poprzez zmianę nazw kolumn lub tabel, zmianę tekstu na liczby, usunięcie wierszy lub ustawienie pierwszego wiersza jako nagłówka.
Power Query Edytor w programie szeroko Power BI Desktop korzysta z menu skrótów (nazywanych również menu wyświetlanych po kliknięciu prawym przyciskiem myszy lub menu kontekstowych), a także z zadań dostępnych na wstążce. Większość elementów, które można zaznaczyć na karcie Przekształć na wstążce, jest również dostępna po kliknięciu prawym przyciskiem myszy elementu (na przykład kolumny), a następnie wybraniu polecenia z wyświetlonego menu skrótów.
Dane kształtu
Kształtując dane w Power Query Edytorze, udostępniasz instrukcje krok po kroku, które Power Query Redaktor wykona w celu dostosowania danych podczas ich ładowania i prezentacji. Nie ma to wpływu na oryginalne źródło danych. Tylko ten konkretny widok danych jest dostosowywany lub kształtowany.
Określone kroki (na przykład zmiana nazwy tabeli, przekształcenie typu danych lub usunięcie kolumn) są rejestrowane przez Power Query Redaktora. Te kroki są następnie wykonywane za każdym razem, gdy zapytanie łączy się ze źródłem danych, dzięki czemu dane są zawsze kształtowane w określony sposób. Ten proces występuje za każdym razem, gdy używasz zapytania w Power BI Desktop lub za każdym razem, gdy ktoś inny używa Twojego zapytania udostępnionego Power BI (na przykład w usłudze). Kroki są przechwytywane sekwencyjnie w obszarze Zastosowane kroki w okienku Power Query Ustawienia .
Na poniższej ilustracji przedstawiono okienko Ustawienia zapytania dla zapytania, które zostało ukształtowane. Przejdziemy przez każdy z kroków w kilku następnych akapitach.
Wróćmy do danych wycofania, które znaleźliśmy, łącząc się z internetowym źródłem danych, i ukształtujmy te dane tak, aby odpowiadały naszym potrzebom.
Nuta
Zobacz poprzednią stronę jednostki, jeśli nie pobrano przykładowego zestawu danych.
Potrzebujemy, aby dane były liczbami. W tym przypadku są one w porządku, ale jeśli kiedykolwiek zajdzie potrzeba zmiany typu danych, po prostu kliknij prawym przyciskiem myszy nagłówek kolumny, a następnie wybierz polecenie Zmień typ > liczby całkowitej. Jeśli musisz zmienić więcej niż jedną kolumnę, zaznacz jedną z nich, a następnie przytrzymaj Shift podczas zaznaczania dodatkowych sąsiednich kolumn. Następnie kliknij prawym przyciskiem myszy nagłówek kolumny, aby zmienić wszystkie wybrane kolumny. Możesz także użyć Ctrl , aby zaznaczyć niesąsiadujące ze sobą kolumny.
Nuta
Często wykryje, Power Query że kolumna tekstu powinna być liczbami i automatycznie zmieni typ danych, gdy przeniesie tabelę do Power Query Edytora. W takim przypadku krok w obszarze Zastosowane kroki identyfikuje, co Power Query zrobiłeś dla Ciebie.
Możesz również zmienić lub przekształcić te kolumny z tekstu do nagłówka za pomocą karty Przekształć na wstążce. Na poniższej ilustracji przedstawiono kartę Przekształć . Czerwone pole podświetla przycisk Typ danych, który umożliwia przekształcenie bieżącego typu danych na inny.
Zwróć uwagę, że lista Zastosowane kroki w okienku Ustawienia zapytania odzwierciedla wszystkie wprowadzone zmiany. Aby usunąć dowolny krok z procesu kształtowania, po prostu zaznacz go, a następnie wybierz X po lewej stronie.
Połącz z danymi
Te dane o różnych stanach są interesujące i będą przydatne do tworzenia dodatkowych wysiłków analitycznych i zapytań. Jest jednak jeden problem: większość dostępnych danych używa dwuliterowego skrótu dla kodów stanów, a nie pełnej nazwy stanu. Dlatego potrzebujemy jakiegoś sposobu na powiązanie nazw stanów z ich skrótami.
Mamy szczęście: istnieje inne publiczne źródło danych, które właśnie to robi, ale wymaga sporo kształtowania, zanim będziemy mogli połączyć je z naszą tabelą emerytalną. Oto zasób sieci Web dla skrótów stanów:
http://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations
W Power Query Edytorze na karcie Narzędzia główne na wstążce wybierz pozycję Nowe źródło > sieci Web. Następnie wprowadź adres i wybierz przycisk OK. Okno Nawigator pokazuje, co znaleziono na tej stronie internetowej.
Wybierz opcję Kody i skróty... tabela, ponieważ zawiera dane, których potrzebujemy, chociaż będzie to wymagało sporo kształtowania, aby ograniczyć te dane.
Wybierz pozycję Załaduj , aby przenieść dane do Power Query Edytora , abyśmy mogli je kształtować. Następnie wykonaj następujące kroki:
Usuń trzy górne wiersze – Te wiersze wynikają ze sposobu, w jaki została utworzona tabela strony internetowej i nie potrzebujemy ich. Aby je usunąć, na karcie Narzędzia główne na wstążce wybierz pozycję Usuń wiersze Usuń górne wiersze > . W wyświetlonym oknie dialogowym wprowadź 3 jako liczbę wierszy do usunięcia.
Usuń dolne 26 wierszy – Wszystkie te wiersze dotyczą terytoriów, których nie musimy uwzględniać. Proces jest taki sam, ale tym razem wybierz pozycję Usuń wiersze > Usuń dolne wiersze i wprowadź 26 jako liczbę wierszy do usunięcia.
Odfiltruj Waszyngton, DC– Tabela statystyk przejścia na emeryturę nie obejmuje Waszyngtonu, więc wykluczymy go z naszej listy. Wybierz strzałkę listy rozwijanej obok kolumny Stan federalny, a następnie wyczyść pole wyboru Okręg federalny .
Usuń kilka niepotrzebnych kolumn– Potrzebujemy tylko mapowania każdego stanu na jego oficjalny dwuliterowy skrót, a informacje te są podane w pierwszej i czwartej kolumnie. Dlatego wystarczy zachować te dwie kolumny i usunąć wszystkie pozostałe. Zaznacz pierwszą kolumnę do usunięcia, a następnie przytrzymaj naciśnięty Ctrl podczas wybierania innych kolumn do usunięcia (umożliwia to zaznaczenie wielu niesąsiadujących ze sobą kolumn). Następnie na karcie Narzędzia główne na wstążce wybierz pozycję Usuń kolumny > Usuń kolumny.
Użyj pierwszego wiersza jako nagłówków– Ponieważ usunęliśmy trzy górne wiersze , bieżący górny wiersz jest nagłówkiem, który chcemy. Wybierz przycisk Użyj pierwszego wiersza jako nagłówków .
Nuta
Jest to dobry moment, aby zwrócić uwagę, że sekwencja zastosowanych kroków w Edytorze Power Query jest ważna i może wpływać na kształt danych. Ważne jest również, aby zastanowić się, w jaki sposób jeden krok może wpłynąć na inny kolejny krok. Jeśli usuniesz krok z listy Zastosowane kroki , kolejne kroki mogą nie zachowywać się zgodnie z pierwotnym zamierzeniem ze względu na wpływ sekwencji kroków zapytania.
Zmień nazwy kolumn i samej tabeli– Jak zwykle, istnieje kilka sposobów zmiany nazwy kolumny. Możesz użyć w dowolny sposób. Zmieńmy ich nazwy na Nazwa stanu i Kod stanu. Aby zmienić nazwę tabeli, wystarczy wprowadzić nazwę w polu Nazwa w okienku Ustawienia zapytania. Nazwijmy tę tabelę StateCodes.
Łączenie danych
Teraz, gdy tabela StateCodes jest ukształtowana, możemy połączyć nasze dwie tabele w jedną. Ponieważ tabele, które teraz mamy, są wynikiem zapytań zastosowanych do danych, są one często nazywane zapytaniami.
Istnieją dwa podstawowe sposoby łączenia zapytań: scalanie i dołączanie.
Jeśli masz co najmniej jedną kolumnę, którą chcesz dodać do innej kwerendy, scalasz zapytania. Jeśli masz dodatkowe wiersze danych, które chcesz dodać do istniejącego zapytania, dołącz kwerendę.
W takim przypadku chcemy scalić zapytania. Aby rozpocząć, wybierz zapytanie, z którym chcesz scalić inne zapytanie . Następnie na karcie Narzędzia główne na wstążce wybierz pozycję Scal zapytania. Najpierw chcemy wybrać nasze zapytanie dotyczące wycofania. Skoro już przy tym jesteśmy, zmieńmy nazwę tego zapytania na RetirementStats.
Zostanie wyświetlone okno dialogowe Scalanie z monitem o wybranie tabeli do scalenia z wybraną tabelą oraz pasujących kolumn do użycia w korespondencji seryjnej.
Wybierz pozycję State z tabeli RetirementStats (zapytanie), a następnie wybierz zapytanie StateCodes . (W tym przypadku wybór jest prosty, ponieważ istnieje tylko jedno inne zapytanie. Jednak po nawiązaniu połączenia z wieloma źródłami danych będzie wiele zapytań do wyboru). Po wybraniu prawidłowych pasujących kolumn — State z RetirementStatsi State Name from StateCodes — okno dialogowe Scalanie będzie wyglądać następująco, aprzycisk OK stanie się dostępny.
NewColumn jest tworzony na końcu zapytania i jest zawartością tabeli (zapytania), która została scalona z istniejącym zapytaniem. Wszystkie kolumny ze scalonego zapytania są skondensowane w NewColumn , ale możesz rozwinąć tabelę i dołączyć dowolne kolumny. Aby rozwinąć scaloną tabelę i wybrać kolumny do uwzględnienia, wybierz ikonę rozwijania (). Zostanie wyświetlone okno dialogowe Rozwiń .
W tym przypadku potrzebujemy tylko kolumny Kod stanu. W związku z tym zaznacz tylko tę kolumnę, a następnie wybierz przycisk OK. Można również wyczyścić pole wyboru Użyj oryginalnej nazwy kolumny jako prefiksu . Jeśli pozostawisz ją zaznaczoną, scalona kolumna będzie miała nazwę NewColumn.State Code (oryginalna nazwa kolumny lub NewColumn, następnie kropka, a następnie nazwa kolumny, która jest wprowadzana do zapytania).
Nuta
Jeśli chcesz, możesz pobawić się sposobem wprowadzania tabeli NewColumn . Jeśli wyniki nie są zadowalające, po prostu usuń krok Rozwiń z listy Zastosowane kroki w okienku Ustawienia zapytania. Zapytanie powróci do stanu, w jakim znajdowało się przed zastosowaniem tego kroku. To jak swobodna przeróbka, którą możesz robić tyle razy, ile chcesz, aż proces rozszerzania będzie wyglądał tak, jak chcesz.
Mamy teraz jedno zapytanie (tabelę), które łączy dwa źródła danych, z których każde zostało ukształtowane zgodnie z naszymi potrzebami. To zapytanie może służyć jako podstawa dla wielu dodatkowych, interesujących połączeń danych, takich jak statystyki kosztów mieszkaniowych, dane demograficzne lub możliwości pracy w dowolnym stanie.
Aby zastosować zmiany w Power Query Edytorze i załadować je do Power BI Desktop, wybierz pozycję Zamknij i zastosuj na karcie Narzędzia główne na wstążce.
Dane w modelu są teraz gotowe do pracy. Następnie utworzymy wizualizacje do raportu.
Na razie mamy wystarczająco dużo danych, aby stworzyć kilka interesujących raportów. Power BI Desktop Ponieważ jest to kamień milowy, zapiszmy ten Power BI Desktop plik. Wybierz pozycję Zapisz > plik na karcie Narzędzia główne na wstążce, aby zapisać raport — nazwiemy go Wprowadzenie Power BI Desktop.
Wielki! Przejdźmy teraz do następnej części, w której stworzymy kilka ciekawych efektów wizualnych.