Parhaat käytännöt dimensiomallin luomiseen tietovoita käyttämällä
Dimensiomallin suunnitteleminen on yksi yleisimmistä tehtävistä, joita tietovuon avulla voi tehdä. Tässä artikkelissa kuvataan joitakin parhaita käytäntöjä dimensiomallin luomiseksi tietovuon avulla.
Valmistelutietovuot
Yksi tietojen integrointijärjestelmän keskeisistä kohdista on lähdetoimintajärjestelmästä luettujen tietojen määrän vähentäminen. Perinteisessä tietojen integrointiarkkitehtuurissa tämä vähentäminen tehdään luomalla uusi tietokanta nimeltä valmistelutietokannan. Valmistelutietokannan tarkoituksena on ladata as-is tietoja tietolähteestä valmistelutietokantaan säännöllisin väliajoin.
Tietojen integroinnin muissa vaiheissa käytetään sitten valmistelutietokantaa lähteenä lisämuunnoksille ja muunnetaan se dimensiomallin rakenteeksi.
Suosittelemme, että noudatat samaa lähestymistapaa tietovoita käytettäessä. Luo joukko tietovoita, jotka vastaavat vain tietojen lataamisesta as-is lähdejärjestelmästä (ja vain tarvittavista taulukoista). Tulos tallennetaan sitten tietovuon tallennusrakenteeseen (joko Azure Data Lake Storage tai Dataverse). Tämä muutos varmistaa, että lähdejärjestelmän lukutoiminto on vähäinen.
Seuraavaksi voit luoda muita tietovoita, jotka hankkivat tiedot valmistelutietovoista. Tämän lähestymistavan etuja ovat seuraavat:
- Lähdejärjestelmän lukutoimintojen määrän vähentäminen ja lähdejärjestelmän kuormituksen vähentäminen.
- Pienennä tietoyhdyskäytävien kuormitusta käytettäessä paikallista tietolähdettä.
- Tietojen välikopio täsmäytystä varten, jos lähdejärjestelmän tiedot muuttuvat.
- Muunnoksen tietovoiden lähderiippumaton.
Kuva, jossa korostetaan valmistelun tietovoita ja valmistelutallennusta ja näytetään ne tiedot, joita valmistelutietovuo käyttää tietolähteestä, ja taulukot, jotka on tallennettu joko Cadavers- tai Azure Data Lake Storage -kohteeseen. Taulukot näytetään muunnetaan yhdessä muiden tietovoiden kanssa, jotka sitten lähetetään kyselyinä.
Muunna tietovuot
Kun olet erottanut muunnostietovuot valmistelutietovoista, muunnos on riippumaton lähteestä. Tämä erottelu auttaa, jos siirrät lähdejärjestelmän uuteen järjestelmään. Siinä tapauksessa sinun tarvitsee vain muuttaa valmistelutietovoita. Muunnostietovuot todennäköisesti toimivat ilman ongelmia, koska ne ovat peräisin vain valmistelutietovoista.
Tämä erittely auttaa myös, jos lähdejärjestelmän yhteys on hidas. Muunnoksen tietovuon ei tarvitse odottaa kauan, jotta se saa tietolähteestä hitaan yhteyden kautta tulevat tietueet. Valmistelun tietovuo on jo tehnyt tämän osan, ja tiedot ovat valmiita muunnoskerrokseen.
Kerrostettu arkkitehtuuri
Kerrostettu arkkitehtuuri on arkkitehtuuri, jossa voit suorittaa toimintoja eri kerroksissa. Valmistelu- ja muunnostietovuot voivat olla monikerroksisen tietovuoarkkitehtuurin kaksi kerrosta. Toimintojen käyttö kerroksissa varmistaa tarvittavan vähimmäis ylläpidon. Kun haluat muuttaa jotakin, sinun tarvitsee vain muuttaa se kerrokseen, jossa se sijaitsee. Muiden tasojen pitäisi toimia jatkossakin hyvin.
Seuraavassa kuvassa näkyy tietovoiden monikerroksinen arkkitehtuuri, jossa niiden taulukoita käytetään sitten Power BI:n semanttisissa malleissa.
Käytä laskettua taulukkoa mahdollisimman paljon
Kun käytät tietovuon tulosta toisessa tietovuossa, käytät lasketun taulukon käsitettä, mikä tarkoittaa tietojen noutamista "jo käsitellystä ja tallennetusta" taulukosta. Sama asia voi tapahtua tietovuon sisällä. Kun viittaat taulukoseen toisesta taulukosta, voit käyttää laskettua taulukkoa. Tästä on hyötyä, kun sinulla on useita muunnoksia, jotka on tehtävä useissa taulukoissa. Niitä kutsutaan yleisimmät muunnokset.
Edellisessä kuvassa laskettu taulukko noutaa tiedot suoraan lähteestä. Valmistelu- ja muunnostietovoiden arkkitehtuurissa on kuitenkin todennäköistä, että lasketut taulukot on peräisin valmistelutietovoista.
Tähtirakenteen luominen
Paras dimensiomalli on tähtirakennemalli, jossa on dimensioita ja faktataulukoita, jotka on suunniteltu siten, että kyselyn tekeminen mallista tiedoille on mahdollisimman vähäistä ja jotta tietojen visualisoinnin ymmärtäminen on myös helppoa.
Toimintajärjestelmän samassa asettelussa olevien tietojen tuominen BI-järjestelmään ei ole ihanteellinen ratkaisu. Tietotaulukot tulee remontoida. Joidenkin taulukoiden tulee olla dimensiotaulukon muodossa, jolloin kuvaavat tiedot säilytetään. Joidenkin taulukoiden on oltava faktataulukon muodossa, jotta koostetiedot säilyvät. Faktataulukoiden ja dimensiotaulukoiden paras asettelu on tähtirakenne. Lisätietoja: Tutustu tähtirakenteeseen ja sen merkitykseen Power BI -
Yksilöivän avainarvon käyttäminen dimensioissa
Kun luot dimensiotaulukoita, varmista, että sinulla on avain kullekin. Tämä avain varmistaa, että dimensioiden välillä ei ole monta moneen -suhteita (tai toisin sanoen "heikkoja"). Voit luoda avaimen muunnoksen avulla varmistaaksesi, että sarake tai sarakkeiden yhdistelmä palauttaa yksilöiviä rivejä dimensiossa. Tämän jälkeen tämä sarakkeiden yhdistelmä voidaan merkitä avaimeksi tietovuon taulukossa.
Lisäävän päivityksen luominen suurille faktataulukoille
Faktataulukot ovat aina dimensiomallin suurimpia taulukoita. Suosittelemme, että vähennät näille taulukoille siirrettyjen rivien määrää. Jos sinulla on erittäin suuri faktataulukko, varmista, että käytät lisäävää päivitystä kyseisessä taulukossa. Lisäävä päivitys voidaan tehdä Power BI:n semanttisessa mallissa ja myös tietovuon taulukoissa.
Lisäävän päivityksen avulla voit päivittää vain osan tiedoista, osasta, joka on muuttunut. On olemassa useita vaihtoehtoja, joilla voit valita, mikä tietojen osa päivitetään ja mikä osa säilyy. Lisätietoja: Lisäävän päivityksen käyttäminen Power BI -tietovoiden kanssa
Viittaaminen dimensioiden ja faktataulukoiden luomiseen
Lähdejärjestelmässä on usein taulukko, jota käytetään sekä fakta- että dimensiotaulukoiden luomiseen tietovarastossa. Nämä taulukot ovat hyviä ehdokkaita lasketuille taulukoille ja myös välitietovoille. Yleinen osa prosessia, kuten tietojen puhdistaminen sekä ylimääräisten rivien ja sarakkeiden poistaminen, voidaan tehdä kerran. Käyttämällä viittausta näiden toimintojen tuotoksesta voit luoda dimensio- ja faktataulukot. Tämä menetelmä käyttää laskettua taulukkoa yleisiin muunnoksiin.