Używanie języka R w edytorze Power Query
Język R to zaawansowany język programowania używany przez wielu statystyków, specjalistów ds. danych i analityków danych. W edytorze Power Query programu Power BI Desktop możesz użyć języka R, aby wykonać następujące czynności:
- Przygotowywanie modeli danych.
- Tworzenie raportów.
- Wykonuj oczyszczanie danych, zaawansowane przetwarzanie danych i analizy modeli semantycznych, które obejmują uzupełnianie brakujących danych, predykcje, klastrowanie i nie tylko.
Instalowanie języka R
Język R można pobrać bezpłatnie z repozytorium CRAN .
Instalowanie myszy
Jako warunek wstępny, biblioteka mice musi być zainstalowana w środowisku języka R. Bez myszy przykładowy kod skryptu nie działa prawidłowo. Pakiet mice implementuje metodę radzenia sobie z brakującymi danymi.
Aby zainstalować bibliotekę mice:
Uruchom program
R.exe
, na przykładC:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe
.Uruchom polecenie instalacji w wierszu polecenia języka R:
install.packages('mice')
Używanie skryptu języka R w edytorze Power Query
Aby zademonstrować użycie języka R w edytorze Power Query, w tym przykładzie użyto semantycznego modelu giełdowego zawartego w pliku .csv.
pobierz plik EuStockMarkets_NA.csv. Pamiętaj, gdzie go zapisać.
Załaduj plik do programu Power BI Desktop. Na karcie Narzędzia główne wybierz pozycję Pobierz dane>tekst/plik CSV.
Wybierz plik EuStockMarkets_NA.csv, a następnie wybierz pozycję Otwórz. Dane CSV są wyświetlane w oknie dialogowym pliku tekstowego/CSV.
Wybierz pozycję Załaduj, aby załadować dane z pliku. Po załadowaniu danych w programie Power BI Desktop nowa tabela pojawi się w okienku Pola.
Aby otworzyć Edytor Power Query, na wstążce Narzędzia główne wybierz pozycję Przekształć dane.
Na karcie Przekształć wybierz pozycję Uruchom skrypt języka R. Zostanie wyświetlony edytor skryptu Uruchom język R. W wierszach 15 i 20 brakuje danych, podobnie jak w przypadku innych wierszy, których nie widać na obrazie. W poniższych krokach pokazano, jak język R wykonuje te wiersze.
W tym przykładzie wprowadź następujący kod skryptu w polu skryptu okna uruchom skrypt języka R.
library(mice) tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100) completedData <- complete(tempData,1) output <- dataset output$completedValues <- completedData$"SMI missing values"
Notatka
Może być konieczne zastąpienie zmiennej o nazwie danych wyjściowych, aby prawidłowo utworzyć nowy model semantyczny z zastosowanymi filtrami.
Wybierz pozycję OK. Edytor Power Query wyświetla ostrzeżenie dotyczące prywatności danych.
W komunikacie ostrzegawczym wybierz pozycję Kontynuuj. W wyświetlonym oknie dialogowym Poziomy prywatności ustaw wszystkie źródła danych na Publiczne, aby skrypty języka R działały prawidłowo w usłudze Power BI.
Aby uzyskać więcej informacji na temat ustawień prywatności i ich skutków, zobacz poziomy prywatności programu Power BI Desktop.
Wybierz pozycję Zapisz, aby uruchomić skrypt.
Po uruchomieniu skryptu zobaczysz następujący wynik:
Po wybraniu tabeli obok Danych wyjściowych w wyświetlonej tabeli, zostanie ona przedstawiona, jak pokazano na poniższej ilustracji.
Zwróć uwagę na nową kolumnę w okienku Pola o nazwie completedValues. W kolumnie brakujących wartości SMI brakuje kilku elementów danych. Zobacz, jak język R obsługuje to w następnej sekcji.
Po zaledwie pięciu wierszach skryptu języka R edytor Power Query wypełnił brakujące wartości modelem predykcyjnym.
Tworzenie wizualizacji na podstawie danych skryptu języka R
Teraz możemy utworzyć wizualizację, aby zobaczyć, w jaki sposób skrypt w języku R z biblioteką mice uzupełnia brakujące wartości.
Wszystkie ukończone wizualizacje można zapisać w jednym pliku pbix programu Power BI Desktop i użyć modelu danych oraz skryptów języka R w usłudze Power BI.
Notatka
Możesz pobrać plik ".pbix" ze wszystkimi wykonanymi krokami.
Po przekazaniu pliku pbix do usługi Power BI należy wykonać inne kroki, aby włączyć odświeżanie danych usługi i zaktualizowane wizualizacje:
Włącz zaplanowane odświeżanie dla modelu semantycznego: Aby włączyć zaplanowane odświeżanie skoroszytu zawierającego model semantyczny za pomocą skryptów języka R, zobacz Konfigurowanie zaplanowanego odświeżania. Ten artykuł zawiera również informacje o lokalnych bramach danych.
Zainstaluj bramę: potrzebujesz lokalnej bramy danych (tryb osobisty) zainstalowanej na maszynie, na której znajduje się plik i język R. Usługa Power BI uzyskuje dostęp do tego skoroszytu i ponownie renderuje wszystkie zaktualizowane wizualizacje. Aby uzyskać więcej informacji, zobacz korzystanie z osobistych bram w Power BI.
Zagadnienia i ograniczenia
Istnieją pewne ograniczenia dotyczące zapytań, które obejmują skrypty języka R utworzone w edytorze Power Query:
Wszystkie ustawienia źródła danych R muszą być ustawione na Publiczny. Wszystkie inne kroki zapytania edytora Power Query muszą być również publiczne.
Aby uzyskać dostęp do ustawień źródła danych, w programie Power BI Desktop wybierz pozycję Plik>Opcje i ustawienia>Ustawienia źródła danych.
W oknie dialogowym ustawień źródła danych wybierz jedno lub więcej źródeł danych, a następnie wybierz Edytuj uprawnienia. Ustaw poziom prywatności na publiczny.
Aby zaplanować odświeżanie wizualizacji języka R lub modelu semantycznego, włącz zaplanowane odświeżanie i zainstaluj lokalną bramę danych (tryb osobisty) na komputerze zawierającym skoroszyt i język R. Nie można użyć bramy przedsiębiorstwa do odświeżania modeli semantycznych zawierających skrypty języka R w dodatku Power Query.
Powiązana zawartość
Istnieją różne rodzaje rzeczy, które można wykonać za pomocą języka R i zapytań niestandardowych. Eksploruj i kształtuj dane tak, jak chcesz je wyświetlać.