Udostępnij za pośrednictwem


Używanie języka R w edytorze Power Query

Język R to zaawansowany język programowania używany przez wielu statystyków, specjalistów ds. danych i analityków danych. W edytorze Power Query programu Power BI Desktop możesz użyć języka R, aby wykonać następujące czynności:

  • Przygotowywanie modeli danych.
  • Tworzenie raportów.
  • Wykonuj oczyszczanie danych, zaawansowane przetwarzanie danych i analizy modeli semantycznych, które obejmują uzupełnianie brakujących danych, predykcje, klastrowanie i nie tylko.

Instalowanie języka R

Język R można pobrać bezpłatnie z repozytorium CRAN .

Instalowanie myszy

Jako warunek wstępny, biblioteka mice musi być zainstalowana w środowisku języka R. Bez myszy przykładowy kod skryptu nie działa prawidłowo. Pakiet mice implementuje metodę radzenia sobie z brakującymi danymi.

Aby zainstalować bibliotekę mice:

  1. Uruchom program R.exe, na przykład C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe.

  2. Uruchom polecenie instalacji w wierszu polecenia języka R:

    install.packages('mice') 
    

Używanie skryptu języka R w edytorze Power Query

Aby zademonstrować użycie języka R w edytorze Power Query, w tym przykładzie użyto semantycznego modelu giełdowego zawartego w pliku .csv.

  1. pobierz plik EuStockMarkets_NA.csv. Pamiętaj, gdzie go zapisać.

  2. Załaduj plik do programu Power BI Desktop. Na karcie Narzędzia główne wybierz pozycję Pobierz dane>tekst/plik CSV.

    Zrzut ekranu przedstawia opcję Pobierz dane, w której można wybrać pozycję Tekst/CSV.

  3. Wybierz plik EuStockMarkets_NA.csv, a następnie wybierz pozycję Otwórz. Dane CSV są wyświetlane w oknie dialogowym pliku tekstowego/CSV.

    Zrzut ekranu przedstawia zawartość wybranego pliku .csv.

  4. Wybierz pozycję Załaduj, aby załadować dane z pliku. Po załadowaniu danych w programie Power BI Desktop nowa tabela pojawi się w okienku Pola.

    Zrzut ekranu przedstawia dane w okienku Pola.

  5. Aby otworzyć Edytor Power Query, na wstążce Narzędzia główne wybierz pozycję Przekształć dane.

    Zrzut ekranu przedstawia wstążkę Strona główna z wyróżnioną opcją Przekształć dane.

  6. Na karcie Przekształć wybierz pozycję Uruchom skrypt języka R. Zostanie wyświetlony edytor skryptu Uruchom język R. W wierszach 15 i 20 brakuje danych, podobnie jak w przypadku innych wierszy, których nie widać na obrazie. W poniższych krokach pokazano, jak język R wykonuje te wiersze.

    [Zrzut ekranu przedstawia edytor Power Query z wybranym poleceniem Uruchom skrypt języka R.

  7. W tym przykładzie wprowadź następujący kod skryptu w polu skryptu okna uruchom skrypt języka R.

       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Notatka

    Może być konieczne zastąpienie zmiennej o nazwie danych wyjściowych, aby prawidłowo utworzyć nowy model semantyczny z zastosowanymi filtrami.

  8. Wybierz pozycję OK. Edytor Power Query wyświetla ostrzeżenie dotyczące prywatności danych.

    Zrzut ekranu przedstawia ostrzeżenie dotyczące prywatności danych z opcją Kontynuuj.

  9. W komunikacie ostrzegawczym wybierz pozycję Kontynuuj. W wyświetlonym oknie dialogowym Poziomy prywatności ustaw wszystkie źródła danych na Publiczne, aby skrypty języka R działały prawidłowo w usłudze Power BI.

    Zrzut ekranu przedstawia okno dialogowe Poziomy prywatności z wybraną funkcją Prywatność publiczna.

    Aby uzyskać więcej informacji na temat ustawień prywatności i ich skutków, zobacz poziomy prywatności programu Power BI Desktop.

  10. Wybierz pozycję Zapisz, aby uruchomić skrypt.

    Po uruchomieniu skryptu zobaczysz następujący wynik:

    Zrzut ekranu przedstawiający wyniki skryptu języka R.

    Po wybraniu tabeli obok Danych wyjściowych w wyświetlonej tabeli, zostanie ona przedstawiona, jak pokazano na poniższej ilustracji.

    Zrzut ekranu przedstawiający wyniki tabeli ze skryptu języka R.

    Zwróć uwagę na nową kolumnę w okienku Pola o nazwie completedValues. W kolumnie brakujących wartości SMI brakuje kilku elementów danych. Zobacz, jak język R obsługuje to w następnej sekcji.

    Po zaledwie pięciu wierszach skryptu języka R edytor Power Query wypełnił brakujące wartości modelem predykcyjnym.

Tworzenie wizualizacji na podstawie danych skryptu języka R

Teraz możemy utworzyć wizualizację, aby zobaczyć, w jaki sposób skrypt w języku R z biblioteką mice uzupełnia brakujące wartości.

Zrzut ekranu przedstawia wizualizację skryptu języka R zawierającą brakujące wartości i ukończone wartości.

Wszystkie ukończone wizualizacje można zapisać w jednym pliku pbix programu Power BI Desktop i użyć modelu danych oraz skryptów języka R w usłudze Power BI.

Notatka

Możesz pobrać plik ".pbix" ze wszystkimi wykonanymi krokami.

Po przekazaniu pliku pbix do usługi Power BI należy wykonać inne kroki, aby włączyć odświeżanie danych usługi i zaktualizowane wizualizacje:

  • Włącz zaplanowane odświeżanie dla modelu semantycznego: Aby włączyć zaplanowane odświeżanie skoroszytu zawierającego model semantyczny za pomocą skryptów języka R, zobacz Konfigurowanie zaplanowanego odświeżania. Ten artykuł zawiera również informacje o lokalnych bramach danych.

  • Zainstaluj bramę: potrzebujesz lokalnej bramy danych (tryb osobisty) zainstalowanej na maszynie, na której znajduje się plik i język R. Usługa Power BI uzyskuje dostęp do tego skoroszytu i ponownie renderuje wszystkie zaktualizowane wizualizacje. Aby uzyskać więcej informacji, zobacz korzystanie z osobistych bram w Power BI.

Zagadnienia i ograniczenia

Istnieją pewne ograniczenia dotyczące zapytań, które obejmują skrypty języka R utworzone w edytorze Power Query:

  • Wszystkie ustawienia źródła danych R muszą być ustawione na Publiczny. Wszystkie inne kroki zapytania edytora Power Query muszą być również publiczne.

    Aby uzyskać dostęp do ustawień źródła danych, w programie Power BI Desktop wybierz pozycję Plik>Opcje i ustawienia>Ustawienia źródła danych.

    Zrzut ekranu przedstawia okno dialogowe Opcje i ustawienia, w którym można wybrać ustawienia źródła danych.

    W oknie dialogowym ustawień źródła danych wybierz jedno lub więcej źródeł danych, a następnie wybierz Edytuj uprawnienia. Ustaw poziom prywatności na publiczny.

    Zrzut ekranu przedstawiający okno dialogowe Ustawienia źródła danych, w którym można edytować uprawnienia.

  • Aby zaplanować odświeżanie wizualizacji języka R lub modelu semantycznego, włącz zaplanowane odświeżanie i zainstaluj lokalną bramę danych (tryb osobisty) na komputerze zawierającym skoroszyt i język R. Nie można użyć bramy przedsiębiorstwa do odświeżania modeli semantycznych zawierających skrypty języka R w dodatku Power Query.

Istnieją różne rodzaje rzeczy, które można wykonać za pomocą języka R i zapytań niestandardowych. Eksploruj i kształtuj dane tak, jak chcesz je wyświetlać.