Inleiding

Voltooid

Denk terug aan het scenario waarin u gegevens in Power BI hebt geïmporteerd vanuit verschillende bronnen en dat deze, bij nadere inspectie, niet zijn voorbereid voor analyse. Door welke oorzaken kunnen gegevens niet voorbereid zijn op analyse?

Wanneer u de gegevens onderzoekt, detecteert u diverse problemen, zoals:

  • Een kolom met de naam Status dienstverband bevat alleen numerieke waarden.

  • Diverse kolommen bevatten fouten.

  • Een aantal kolommen bevat null-waarden.

  • De klant-id in een aantal kolommen wordt weergegeven alsof deze herhaaldelijk is gedupliceerd.

  • Eén adreskolom bevat een combinatie van adres, woonplaats, staat en postcode.

U gaat met de gegevens aan de slag, maar steeds wanneer u visuals in rapporten maakt, krijgt u slechte gegevens en onjuiste resultaten. Eenvoudige rapporten over totale verkopen zijn onjuist.

Vuile gegevens kunnen overweldigend zijn en hoewel u zich misschien gefrustreerd voelt, besluit u om aan de slag te gaan en erachter te komen hoe u dit semantische model zo onberispelijk mogelijk kunt maken.

Gelukkig bieden Power BI en Power Query u een krachtige omgeving om de gegevens op te schonen en voor te bereiden. Het opschonen van gegevens heeft de volgende voordelen:

  • Metingen en kolommen produceren nauwkeurigere resultaten wanneer hiermee aggregaties en berekeningen worden uitgevoerd.

  • Tabellen worden geordend, waarin gebruikers de gegevens op een intuïtieve manier kunnen zoeken.

  • Dubbele items worden verwijderd, waardoor u eenvoudiger door de gegevens kunt navigeren. Ook worden kolommen geproduceerd die worden gebruikt in slicers en filters.

  • Een ingewikkelde kolom kan worden gesplitst in twee eenvoudigere kolommen. Meerdere kolommen worden gecombineerd in één kolom voor betere leesbaarheid.

  • Codes en gehele getallen worden vervangen door waarden die door mensen kunnen worden gelezen.

In deze module wordt het volgende behandeld:

  • Conflicten, onverwachte waarden of null-waarden en problemen met de kwaliteit van gegevens oplossen.

  • Gebruikersvriendelijke vervangende waarden toepassen.

  • Gegevens profileren zodat u meer kunt leren over een specifieke kolom voordat u deze gebruikt.

  • Kolomgegevenstypen evalueren en transformeren.

  • Vormtransformaties van gegevens toepassen op tabelstructuren.

  • Query's combineren.

  • Gebruikersvriendelijke naamconventies toepassen op kolommen en query's.

  • M-code bewerken in de geavanceerde editor.