Esittely
Suuren semanttisen mallin luominen on yksi tärkeimmistä tehtävistä, joita tietoanalyytikko voi Microsoft Power BI:ssä suorittaa. Kun teet tämän työn hyvin, autat käyttäjiä ymmärtämään tietoja. Se tekee hyödyllisten Power BI -raporttien luomisesta tavallista helpompaa käyttäjille ja sinulle.
Tämän moduulin sivut ovat vain ohjeita, datatiedostoja ei ole annettu. Sinulla on mahdollisuus käsitellä oikeita tietoja labratöissä.
Hyvä semanttinen malli tarjoaa seuraavat edut:
tietojen tarkasteleminen on tavallista nopeampaa
koosteiden luominen on yksinkertaisempaa
raportit ovat tavallista tarkempia
raporttien kirjoittaminen on tavallista nopeampaa
raportteja on tavallista helpompi ylläpitää jatkossa.
Hyvän semanttisen mallin luomiseen on vaikea määrittää sääntöjä, koska kaikki tiedot ovat erilaisia ja niiden käyttö vaihtelee. Yleensä pienempi semanttinen malli on parempi, koska se toimii nopeammin ja on yksinkertaisempi käyttää. Pienen semanttisen mallin sisältöjen määrittäminen on kuitenkin yhtä ongelmallista, koska se on heuristinen ja subjektiivinen käsite.
Yleensä pieni semanttinen malli koostuu pienemmästä taulukosta ja pienemmistä sarakkeista kussakin taulukossa, jotka käyttäjä voi nähdä. Jos tuot kaikki tarvittavat taulukot myyntitietokannasta, mutta taulukoiden kokonaismäärä on 30 taulukkoa, käyttö ei ole käyttäjälle helppoa. Näiden taulukoiden tiivistäminen viideksi taulukoksi tekee semanttisesta mallista helppokäyttöisempi. Jos taas käyttäjä avaa taulukon ja löytää 100 saraketta, se voi tehdä mallista ylivoimaisen vaikean. Tarpeettomien sarakkeiden poistaminen helpommin hallittavan määrän tarjoamiseksi lisää todennäköisyyttä, että käyttäjä lukee kaikkien sarakkeiden nimet. Yhteenvetona voidaan todeta, että sinun kannattaa pyrkiä yksinkertaisuuteen semanttisia malleja suunniteltaessa.
Seuraavassa kuvassa on esimerkki semanttisesta mallista. Ruudut sisältävät tietotaulukoita, joissa jokainen ruudun sisällä oleva rivikohde on sarake. Ruutuja yhdistävät viivat edustavat taulukoiden välisiä suhteita. Nämä suhteet voivat olla monimutkaisia myös tällaisessa yksinkertaisessa mallissa. Semanttinen malli voi helposti olla epäjärjestystä ja taulukoiden kokonaismäärä mallissa voi kasvaa asteittain. Semanttisen mallin pitäminen yksinkertaisena, kattavana ja täsmällisenä edellyttää jatkuvaa työtä.
Suhteet määritetään taulukoiden välillä perusavaimen ja viiteavaimen avulla. Perusavaimet ovat sarakkeita, jotka yksilöivät jokaisen yksilöllisen, muun kuin tyhjäarvoisen tietorivin. Jos sinulla on esimerkiksi Asiakkaat-taulukko, voit luoda hakemiston, joka yksilöi kunkin yksilöllisen asiakkaan. Ensimmäisellä rivillä on tunnus 1, toisella rivillä tunnus 2 ja niin edelleen. Jokaiselle riville määritetään yksilöllinen arvo, johon voidaan viitata tällä yksinkertaisella arvolla: perusavaimella. Tästä prosessista tulee tärkeä, kun viitataan toisessa taulukossa oleviin riveihin, mikä tehdään viiteavainten avulla. Taulukoiden väliset suhteet muodostetaan, kun perusavaimet ja viiteavaimet ovat yhteisiä eri taulukoiden välillä.
Power BI:n avulla voidaan muodostaa suhteita taulukoista, joissa on eri tietolähteitä. Tämä on tehokas ominaisuus, jonka avulla voit vetää yhden taulukon Microsoft Excelistä ja toisen relaatiotietokannasta. Sen jälkeen voit luoda suhteen näiden kahden taulukon välille ja käsitellä niitä yhtenäisenä semanttisena mallina.
Nyt kun olet saanut tietoja suhteista, jotka muodostavat tietorakenteen, voit tutkia tietyntyyppistä rakennetta, tähtirakennetta, joka on optimoitu suurta suorituskykyä ja käytettävyyttä varten.
Tähtirakenteet
Voit suunnitella tähtirakenteen tietojen yksinkertaistamista varten. Se ei ole ainoa tapa yksinkertaistaa tietoja, mutta se on suosittu menetelmä. Siksi jokaisen Power BI -tietoanalyytikon on hyvä ymmärtää se. Tähtirakenteessa jokainen semanttisen mallisi taulukko määritetään dimensio- tai faktataulukoksi seuraavassa visualisoinnissa esitetyllä tavalla.
Faktataulukot sisältävät havainto- tai tapahtumatietoarvoja: myyntitilauksia, tuotemääriä, hintoja, tapahtumapäivämääriä ja -aikoja sekä määriä. Faktataulukot voivat sisältää useita toistuvia arvoja. Yksi tuote voi esimerkiksi näkyä useita kertoja useilla riveillä eri asiakkaita varten eri päivämäärinä. Näitä arvoja voidaan koota yhteen visualisointien luomista varten. Esimerkiksi myyntitilausten visualisointi on kooste faktataulukon kaikista myyntitilauksista. Faktataulukoissa on usein sarakkeita, jotka ovat täynnä lukuja ja päivämääriä. Luvut voivat olla mittayksiköitä, kuten myyntimääriä, tai ne voivat olla avaimia, kuten asiakastunnuksia. Päivämäärät edustavat tallennettua aikaa, kuten tilauspäivämäärää tai toimituspäivämäärää.
Dimensiotaulukot sisältävät yksityiskohtia faktataulukoissa olevista tiedoista: tuotteet, sijainnit, työntekijät ja tilaustyypit. Nämä taulukot yhdistetään faktataulukkoon avainsarakkeiden kautta. Dimensiotaulukoita käytetään faktataulukoissa olevien tietojen suodattamiseen ja ryhmittelemiseen. Faktataulukot taas sisältävät mitattavissa olevia tietoja, kuten myynnin ja tuoton, ja kukin rivi edustaa dimensiotaulukoiden yksilöllistä arvojen yhdistelmää. Myyntitilausten kokonaismäärän visualisoinnissa voit ryhmitellä tiedot niin, että näet myyntitilausten kokonaismäärät tuotteittain, jolloin tuote on dimensiotaulukossa oleva tieto.
Faktataulukot ovat paljon suurempia kuin dimensiotaulukot, koska monet tapahtumat, kuten yksittäiset myyntitapahtumat, näkyvät faktataulukoissa. Dimensiotaulukot ovat yleensä pienempiä, koska suodatettavien ja ryhmiteltävien kohteiden määrä on rajallinen. Esimerkiksi vuosi sisältää vain tietyn määrän kuukausia, ja Yhdysvallat koostuvat vain tietystä määrästä osavaltioita.
Kun otetaan huomioon nämä tiedot faktataulukoista ja dimensiotaulukoista, saatat ihmetellä, miten tällainen visualisointi voidaan luoda Power BI:ssä.
Olennaiset tiedot ovat kahdessa taulukossa, Employee ja Sales, kuten seuraavassa semanttisessa mallissa on esitetty. Koska Sales-taulukko sisältää myyntitilauksen arvot, jotka voidaan koota yhteen, sitä käsitellään faktataulukkona. Employee-taulukko sisältää tietyn työntekijän nimen, joka suodattaa myyntitilaukset, joten kyseessä on dimensiotaulukko. Yhteinen sarake kahden taulukon välillä on EmployeeID, joka on Employee-taulukon ensisijainen avain. Voit sen avulla muodostaa suhteen kahden tähän sarakkeeseen perustuvan taulukon välillä.
Kun luot tätä suhdetta, voit luoda visualisoinnin vaatimusten mukaisesti seuraavassa kuvassa esitetyllä tavalla. Jos et olisi määrittänyt tätä suhdetta, kun huomioit kahden taulukon yhteiset ominaisuudet, sinulla olisi ollut enemmän vaikeuksia visualisoinnin luomisessa.
Tähtirakenteet ja pohjana oleva semanttinen malli ovat järjestelmällisten raporttien perusta. Mitä enemmän aikaa käytät näiden yhteyksien luomisessa ja suunnittelussa, sitä helpompaa on luoda ja ylläpitää raportteja.