Introduktion
Tänk dig ett scenario där du har importerat data till Power BI från flera olika källor och att de inte verkar klara för analys när du undersöker dem. Vad kan göra att data inte är klara för analys?
När du undersöker data upptäcker du flera problem, bland annat följande:
En kolumn med namnet Employment status innehåller bara siffror.
Flera kolumner innehåller fel.
Vissa kolumner innehåller nullvärden.
Kund-ID:t i vissa kolumner verkar ha ett antal dubbletter.
En enda adresskolumn innehåller gatuadress, stad, delstat och postnummer.
Du börjar arbeta med dina data, men varje gång du skapar visuella objekt i rapporter så får du felaktiga data, felaktiga resultat och enkla rapporter om försäljningssummor blir helt fel.
Smutsiga data kan vara överväldigande och även om du kan känna dig frustrerad bestämmer du dig för att börja arbeta och ta reda på hur du gör den här semantiska modellen så orörd som möjligt.
Lyckligtvis är Power BI och Power Query en kraftfull miljö där du kan rensa och förbereda dina data. Rensade data har följande fördelar:
Mått och kolumner ger bättre resultat vid aggregeringar och beräkningar.
Tabeller är organiserade så att användarna kan hitta data intuitivt.
Dubbletter tas bort så att datanavigeringen blir enklare. Dessutom produceras kolumner som kan användas i utsnitt och filter.
En komplicerad kolumn kan delas upp i två, enklare kolumner. Flera kolumner kan slås ihop till en enda kolumn som är enklare att läsa.
Koder och heltal kan ersättas med läsliga värden.
I den här modulen får du lära dig följande:
Lösa inkonsekvenser, oväntade värden eller nullvärden och problem med datakvaliteten.
Använda användarvänliga värdeersättningar.
Profilera data så att du kan lära dig mer om en viss kolumn innan du använder den.
Utvärdera och transformera kolumndatatyper.
Transformera dataformer till tabellstrukturer.
Kombinera frågor.
Använda användarvänliga namngivningskonventioner för kolumner och frågor.
Redigera M-kod i den avancerade redigeraren.