Del via


Brug Python i Power Query-editor

Du kan bruge Python, som er et programmeringssprog, der i vid udstrækning bruges af statistikere, dataspecialister og dataanalytikere, i Power BI Desktop-Power Query-editor. Med denne integration af Python i Power Query-editor kan du udføre datarensning ved hjælp af Python og udføre avanceret dataudformning og -analyse i datasæt, herunder fuldførelse af manglende data, forudsigelser og klyngedannelse, blot for at nævne nogle få. Python er et effektivt sprog og kan bruges i Power Query-editor til at forberede din datamodel og oprette rapporter.

Forudsætninger

Du skal installere Python og pandas, før du begynder.

  • Installér Python – Hvis du vil bruge Python i Power BI Desktops Power Query-editor, skal du installere Python på din lokale computer. Du kan downloade og installere Python gratis fra mange steder, herunder den officielle Python-downloadside og Anaconda.

  • Installér pandas – Hvis du vil bruge Python med Power Query-editor, skal du også installere pandas. Pandas bruges til at flytte data mellem Power BI og Python-miljøet.

Brug Python sammen med Power Query-editor

Hvis du vil vise, hvordan du bruger Python i Power Query-editor, skal du tage dette eksempel fra et aktiemarkedsdatasæt, der er baseret på en CSV-fil, som du kan downloade herfra og følge med. Trinnene i dette eksempel er følgende procedure:

  1. Først skal du indlæse dine data i Power BI Desktop. I dette eksempel skal du indlæse filen EuStockMarkets_NA.csv og vælge Hent data>Tekst/CSVbåndet Hjem i Power BI Desktop.

    Screenshot of the Get Data ribbon in Power BI Desktop, showing the CSV selection.

  2. Vælg filen, og vælg Åbn, hvorefter CSV-filen vises i dialogboksen CSV-fil .

    Screenshot of the CSV file dialog, showing the selected CSV.

  3. Når dataene er indlæst, kan du se dem i ruden Felter i Power BI Desktop.

    Screenshot of the Fields pane, showing the loaded data.

  4. Åbn Power Query-editor ved at vælge Transformér datafanen Hjem i Power BI Desktop.

    Screenshot of the Power Query Editor in Power BI Desktop, showing the Transform data selection.

  5. Under fanen Transformér skal du vælge Kør Python-script, hvorefter editoren Kør Python-script vises som vist i næste trin. Række 15 og 20 lider af manglende data, ligesom andre rækker, du ikke kan se på følgende billede. Følgende trin viser, hvordan Python fuldfører disse rækker for dig.

    Screenshot of the Transform tab, showing rows of data.

  6. I dette eksempel skal du angive følgende scriptkode:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Bemærk

    Pandas-biblioteket skal være installeret i Python-miljøet, for at den forrige scriptkode fungerer korrekt. Hvis du vil installere pandas, skal du køre følgende kommando i Python-installationen: pip install pandas

    Når koden placeres i dialogboksen Kør Python-script , ser den ud som i følgende eksempel:

    Screenshot of the Run Python Script dialog, showing the script code.

  7. Når du har valgt OK, viser Power Query-editor en advarsel om beskyttelse af personlige oplysninger.

    Screenshot of the Power Query Editor pane, showing the warning about data privacy.

  8. Hvis Python-scripts skal fungere korrekt i Power BI-tjeneste, skal alle datakilder være angivet til offentlige. Du kan få flere oplysninger om indstillinger for beskyttelse af personlige oplysninger og deres konsekvenser under Niveauer for beskyttelse af personlige oplysninger.

    Screenshot of the Privacy levels dialog, showing that Public is set.

    Bemærk en ny kolonne i ruden Felter , der kaldes completedValues. Bemærk, at der mangler nogle dataelementer, f.eks. i række 15 og 18. Se, hvordan Python håndterer dette i næste afsnit.

Med kun tre linjer Python-script Power Query-editor udfyldt de manglende værdier med en forudsigende model.

Opret visualiseringer ud fra Python-scriptdata

Nu kan vi oprette en visualisering for at se, hvordan Python-scriptkoden ved hjælp af pandas-biblioteket har fuldført de manglende værdier, som vist på følgende billede:

Screenshot of the visual, showing original data and completed missing values of the pandas library.

Når visualiseringen er fuldført, og alle andre visualiseringer, du vil oprette ved hjælp af Power BI Desktop, kan du gemme Power BI Desktop-filen . Power BI Desktop-filer gemmes med filtypenavnet .pbix . Brug derefter datamodellen, herunder De Python-scripts, der er en del af den, i Power BI-tjeneste.

Bemærk

Vil du se en fuldført .pbix-fil, hvor disse trin er fuldført? Du er heldig. Du kan downloade den færdige Power BI Desktop-fil , der bruges i disse eksempler , lige her.

Når du uploader .pbix-filen til Power BI-tjeneste, er der et par yderligere trin, der er nødvendige for at aktivere data, der kan opdateres i tjenesten, og for at gøre det muligt for visualiseringer at blive opdateret i tjenesten. Dataene skal have adgang til Python, for at visualiseringerne kan opdateres. De andre trin er følgende trin:

  • Aktivér planlagt opdatering af datasættet. Hvis du vil aktivere planlagt opdatering af den projektmappe, der indeholder dit datasæt med Python-scripts, skal du se Konfiguration af planlagt opdatering, som også indeholder oplysninger om personlig gateway.
  • Installér den personlige gateway. Du skal have installeret en personlig gateway på den computer, hvor filen er placeret, og hvor Python er installeret. Den Power BI-tjeneste skal have adgang til projektmappen og gengive eventuelle opdaterede visualiseringer igen. Du kan få mere at vide under Installér og konfigurer personlig gateway.

Overvejelser og begrænsninger

Der er nogle begrænsninger for forespørgsler, der omfatter Python-scripts, der er oprettet i Power Query-editor:

  • Alle indstillinger for Python-datakilden skal være angivet til Offentlig, og alle andre trin i en forespørgsel, der er oprettet i Power Query-editor, skal også være offentlige. Hvis du vil have vist indstillinger for datakilde, skal du i Power BI Desktop vælge Filindstillinger >> Indstillinger Indstillinger for datakilde.

    Screenshot of the File menu in Power BI Desktop, showing the Data source settings selection.

    I dialogboksen Datakilde Indstillinger skal du vælge datakilderne og derefter vælge Rediger tilladelser... og sikre, at niveauet for beskyttelse af personlige oplysninger er angivet til Offentligt.

    Screenshot of the Data source settings dialog, showing the Privacy Level is set to Public.

  • Hvis du vil aktivere planlagt opdatering af dine Python-visualiseringer eller -datasæt, skal du aktivere Planlagt opdatering og have en personlig gateway installeret på den computer, der indeholder projektmappen og Python-installationen. Du kan finde flere oplysninger om begge dele i det forrige afsnit i denne artikel, som indeholder links til at få mere at vide om hver enkelt.

  • Indlejrede tabeller, som er tabel over tabeller, understøttes ikke i øjeblikket.

Der er mange forskellige ting, du kan gøre med Python og brugerdefinerede forespørgsler, så udforsk og form dine data på den måde, du ønsker, at de skal vises på.