Brug R i Power Query-editor
R-sproget er et effektivt programmeringssprog, som mange statistikere, dataspecialister og dataanalytikere bruger. Du kan bruge R i Power BI Desktops Power Query-editor til at:
- Forbered datamodeller.
- Opret rapporter.
- Udrensning af data, avanceret dataudformning og semantisk modelanalyse, som omfatter manglende datafuldførelse, forudsigelser, klyngedannelse og meget mere.
Installér R
Du kan downloade R gratis fra CRAN-lageret.
Installér mus
Du skal som en forudsætning installere biblioteket mice i R-miljøet. Uden mus fungerer eksempelscriptkoden ikke korrekt. Mice-pakken implementerer en metode til håndtering af manglende data.
Sådan installerer du mice-biblioteket:
Start
R.exe
-programmet, f.eks.C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe
.Kør installationskommandoen fra R-prompten:
install.packages('mice')
Brug et R-script i Power Query-editor
I dette eksempel bruges en semantisk aktiemarkedsmodel, der er indeholdt i en .csv-fil, til at demonstrere brugen af R i Power Query-editor.
Hent EuStockMarkets_NA.csv-filen. Husk, hvor du gemmer den.
Indlæs filen i Power BI Desktop. Vælg Hent data>Tekst/CSV-under fanen Hjem .
Vælg filen EuStockMarkets_NA.csv, og vælg derefter Åbn. CSV-dataene vises i dialogboksen Text/CSV-fil.
Vælg Indlæs for at indlæse dataene fra filen. Når Power BI Desktop har indlæst dataene, vises den nye tabel i ruden Felter.
Hvis du vil åbne Power Query-editor, skal du på båndet Hjem vælge Transformér data.
Vælg Kør R-scriptunder fanen Transformér . Editoren Kør R-script vises. Række 15 og 20 mangler data, ligesom andre rækker, du ikke kan se på billedet. I følgende trin kan du se, hvordan R fuldfører disse rækker for dig.
I dette eksempel skal du angive følgende scriptkode i feltet Script i vinduet Kør R-script.
library(mice) tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100) completedData <- complete(tempData,1) output <- dataset output$completedValues <- completedData$"SMI missing values"
Seddel
Du skal muligvis overskrive en variabel med navnet output for at oprette den nye semantiske model korrekt med de anvendte filtre.
Vælg OK. Der vises en advarsel om beskyttelse af personlige oplysninger i Power Query-editor.
I advarselsmeddelelsen skal du vælge Fortsæt. I dialogboksen niveauer for beskyttelse af personlige oplysninger, der vises, skal du angive alle datakilder til Offentlige, så R-scripts fungerer korrekt i Power BI-tjenesten.
Du kan få flere oplysninger om indstillinger for beskyttelse af personlige oplysninger og deres konsekvenser under niveauer for beskyttelse af personlige oplysninger i Power BI Desktop.
Vælg Gem for at køre scriptet.
Når du kører scriptet, får du vist følgende resultat:
Når du vælger Tabel ud for Output i den tabel, der vises, vises tabellen som vist på følgende billede.
Bemærk, at den nye kolonne i ruden Felter kaldes completedValues. Kolonnen SMI-manglende værdier indeholder et par manglende dataelementer. Se, hvordan R håndterer det i næste afsnit.
Med kun fem linjer R-script udfyldte Power Query-editor de manglende værdier med en forudsigende model.
Opret visualiseringer ud fra R-scriptdata
Vi kan nu oprette en visualisering for at se, hvordan R-scriptkoden med mice-biblioteket fuldfører de manglende værdier.
Du kan gemme alle fuldførte visualiseringer i én .pbix-fil i Power BI Desktop og bruge datamodellen og dens R-scripts i Power BI-tjenesten.
Seddel
Du kan downloade en .pbix-fil med alle disse trin fuldført.
Når du har uploadet .pbix-filen til Power BI-tjenesten, skal du udføre andre trin for at aktivere opdatering af tjenestedata og opdaterede visualiseringer:
Aktivér planlagt opdatering af den semantiske model: Hvis du vil aktivere planlagt opdatering af den projektmappe, der indeholder din semantiske model med R-scripts, skal du se Konfiguration af planlagt opdatering. Denne artikel indeholder også oplysninger om datagateways i det lokale miljø.
Installér en gateway: Du skal have en datagateway i det lokale miljø (personlig tilstand) installeret på den computer, hvor filen og R er placeret. Power BI-tjenesten får adgang til projektmappen og gengiver alle opdaterede visualiseringer igen. Du kan få flere oplysninger under bruge personlige gateways i Power BI.
Overvejelser og begrænsninger
Der er nogle begrænsninger for forespørgsler, der omfatter R-scripts, der er oprettet i Power Query-editor:
Alle R-datakildeindstillinger skal angives til Offentlige. Alle andre trin i en forespørgsel i Power Query-editor skal også være offentlige.
Hvis du vil have vist indstillingerne for datakilden, skal du i Power BI Desktop vælge Filer>Indstillinger>Indstillinger for datakilde.
I dialogboksen Indstillinger for datakilde skal du vælge en eller flere datakilder og derefter vælge Rediger tilladelser. Angiv niveau for beskyttelse af personlige oplysninger til Offentlige.
Hvis du vil planlægge opdatering af dine R-visualiseringer eller semantiske modeller, skal du aktivere planlagt opdatering og installere en datagateway i det lokale miljø (personlig tilstand) på den computer, der indeholder projektmappen og R. Du kan ikke bruge en virksomhedsgateway til at opdatere semantiske modeller, der indeholder R-scripts i Power Query.
Relateret indhold
Der er mange forskellige ting, du kan gøre med R og brugerdefinerede forespørgsler. Udforsk og form dine data på samme måde, som du ønsker, at de skal vises.