Jaa


Parhaat käytännöt dimensiomallin luomiseen tietovoita käyttämällä

Dimensiomallin suunnitteleminen on yksi yleisimmistä tehtävistä, joita tietovuon avulla voi tehdä. Tässä artikkelissa kuvataan joitakin parhaita käytäntöjä dimensiomallin luomiseksi tietovuon avulla.

Valmistelutietovuot

Yksi tietojen integrointijärjestelmän keskeisistä kohdista on lähdetoimintajärjestelmästä luettujen tietojen määrän vähentäminen. Perinteisessä tietojen integrointiarkkitehtuurissa tämä vähentäminen tehdään luomalla uusi tietokanta nimeltä valmistelutietokannan. Valmistelutietokannan tarkoituksena on ladata as-is tietoja tietolähteestä valmistelutietokantaan säännöllisin väliajoin.

Tietojen integroinnin muissa vaiheissa käytetään sitten valmistelutietokantaa lähteenä lisämuunnoksille ja muunnetaan se dimensiomallin rakenteeksi.

Suosittelemme, että noudatat samaa lähestymistapaa tietovoita käytettäessä. Luo joukko tietovoita, jotka vastaavat vain tietojen lataamisesta as-is lähdejärjestelmästä (ja vain tarvittavista taulukoista). Tulos tallennetaan sitten tietovuon tallennusrakenteeseen (joko Azure Data Lake Storage tai Dataverse). Tämä muutos varmistaa, että lähdejärjestelmän lukutoiminto on vähäinen.

Seuraavaksi voit luoda muita tietovoita, jotka hankkivat tiedot valmistelutietovoista. Tämän lähestymistavan etuja ovat seuraavat:

  • Lähdejärjestelmän lukutoimintojen määrän vähentäminen ja lähdejärjestelmän kuormituksen vähentäminen.
  • Pienennä tietoyhdyskäytävien kuormitusta käytettäessä paikallista tietolähdettä.
  • Tietojen välikopio täsmäytystä varten, jos lähdejärjestelmän tiedot muuttuvat.
  • Muunnoksen tietovoiden lähderiippumaton.

valmistelun tietovuot.

Kuva, jossa korostetaan valmistelun tietovoita ja valmistelutallennusta ja näytetään ne tiedot, joita valmistelutietovuo käyttää tietolähteestä, ja taulukot, jotka on tallennettu joko Cadavers- tai Azure Data Lake Storage -kohteeseen. Taulukot näytetään muunnetaan yhdessä muiden tietovoiden kanssa, jotka sitten lähetetään kyselyinä.

Muunna tietovuot

Kun olet erottanut muunnostietovuot valmistelutietovoista, muunnos on riippumaton lähteestä. Tämä erottelu auttaa, jos siirrät lähdejärjestelmän uuteen järjestelmään. Siinä tapauksessa sinun tarvitsee vain muuttaa valmistelutietovoita. Muunnostietovuot todennäköisesti toimivat ilman ongelmia, koska ne ovat peräisin vain valmistelutietovoista.

Tämä erittely auttaa myös, jos lähdejärjestelmän yhteys on hidas. Muunnoksen tietovuon ei tarvitse odottaa kauan, jotta se saa tietolähteestä hitaan yhteyden kautta tulevat tietueet. Valmistelun tietovuo on jo tehnyt tämän osan, ja tiedot ovat valmiita muunnoskerrokseen.

kuva, joka on samankaltainen kuin edellisessä kuvassa, paitsi että korostetaan muunnoksia ja tiedot lähetetään tietovarastoon.

Kerrostettu arkkitehtuuri

Kerrostettu arkkitehtuuri on arkkitehtuuri, jossa voit suorittaa toimintoja eri kerroksissa. Valmistelu- ja muunnostietovuot voivat olla monikerroksisen tietovuoarkkitehtuurin kaksi kerrosta. Toimintojen käyttö kerroksissa varmistaa tarvittavan vähimmäis ylläpidon. Kun haluat muuttaa jotakin, sinun tarvitsee vain muuttaa se kerrokseen, jossa se sijaitsee. Muiden tasojen pitäisi toimia jatkossakin hyvin.

Seuraavassa kuvassa näkyy tietovoiden monikerroksinen arkkitehtuuri, jossa niiden taulukoita käytetään sitten Power BI:n semanttisissa malleissa.

kuva, jossa on monikerroksinen arkkitehtuuri ja jossa valmistelutietovuot ja tietovoiden muuntaminen ovat eri kerroksissa.

Käytä laskettua taulukkoa mahdollisimman paljon

Kun käytät tietovuon tulosta toisessa tietovuossa, käytät lasketun taulukon käsitettä, mikä tarkoittaa tietojen noutamista "jo käsitellystä ja tallennetusta" taulukosta. Sama asia voi tapahtua tietovuon sisällä. Kun viittaat taulukoseen toisesta taulukosta, voit käyttää laskettua taulukkoa. Tästä on hyötyä, kun sinulla on useita muunnoksia, jotka on tehtävä useissa taulukoissa. Niitä kutsutaan yleisimmät muunnokset.

kuva, jossa näkyy laskettu taulukko, joka on peräisin yleisten muunnosten käsittelyyn käytetystä tietolähteestä.

Edellisessä kuvassa laskettu taulukko noutaa tiedot suoraan lähteestä. Valmistelu- ja muunnostietovoiden arkkitehtuurissa on kuitenkin todennäköistä, että lasketut taulukot on peräisin valmistelutietovoista.

laskettu taulukko, joka on peräisin tietovoista, joita käytetään yleisten muunnosten käsittelemiseen.

Tähtirakenteen luominen

Paras dimensiomalli on tähtirakennemalli, jossa on dimensioita ja faktataulukoita, jotka on suunniteltu siten, että kyselyn tekeminen mallista tiedoille on mahdollisimman vähäistä ja jotta tietojen visualisoinnin ymmärtäminen on myös helppoa.

Toimintajärjestelmän samassa asettelussa olevien tietojen tuominen BI-järjestelmään ei ole ihanteellinen ratkaisu. Tietotaulukot tulee remontoida. Joidenkin taulukoiden tulee olla dimensiotaulukon muodossa, jolloin kuvaavat tiedot säilytetään. Joidenkin taulukoiden on oltava faktataulukon muodossa, jotta koostetiedot säilyvät. Faktataulukoiden ja dimensiotaulukoiden paras asettelu on tähtirakenne. Lisätietoja: Tutustu tähtirakenteeseen ja sen merkitykseen Power BI -

tähtirakennekuva, joka näyttää viisikärkisen tähden muodossa faktataulukon, jota ympäröivät dimensiotaulukot.

Yksilöivän avainarvon käyttäminen dimensioissa

Kun luot dimensiotaulukoita, varmista, että sinulla on avain kullekin. Tämä avain varmistaa, että dimensioiden välillä ei ole monta moneen -suhteita (tai toisin sanoen "heikkoja"). Voit luoda avaimen muunnoksen avulla varmistaaksesi, että sarake tai sarakkeiden yhdistelmä palauttaa yksilöiviä rivejä dimensiossa. Tämän jälkeen tämä sarakkeiden yhdistelmä voidaan merkitä avaimeksi tietovuon taulukossa.

merkitse sarake avaimen arvoksi.

Lisäävän päivityksen luominen suurille faktataulukoille

Faktataulukot ovat aina dimensiomallin suurimpia taulukoita. Suosittelemme, että vähennät näille taulukoille siirrettyjen rivien määrää. Jos sinulla on erittäin suuri faktataulukko, varmista, että käytät lisäävää päivitystä kyseisessä taulukossa. Lisäävä päivitys voidaan tehdä Power BI:n semanttisessa mallissa ja myös tietovuon taulukoissa.

Lisäävän päivityksen avulla voit päivittää vain osan tiedoista, osasta, joka on muuttunut. On olemassa useita vaihtoehtoja, joilla voit valita, mikä tietojen osa päivitetään ja mikä osa säilyy. Lisätietoja: Lisäävän päivityksen käyttäminen Power BI -tietovoiden kanssa

tietovoiden lisäävän päivityksen.

Viittaaminen dimensioiden ja faktataulukoiden luomiseen

Lähdejärjestelmässä on usein taulukko, jota käytetään sekä fakta- että dimensiotaulukoiden luomiseen tietovarastossa. Nämä taulukot ovat hyviä ehdokkaita lasketuille taulukoille ja myös välitietovoille. Yleinen osa prosessia, kuten tietojen puhdistaminen sekä ylimääräisten rivien ja sarakkeiden poistaminen, voidaan tehdä kerran. Käyttämällä viittausta näiden toimintojen tuotoksesta voit luoda dimensio- ja faktataulukot. Tämä menetelmä käyttää laskettua taulukkoa yleisiin muunnoksiin.

kuva, jossa näkyy Orders-kysely ja viittausvaihtoehdon käyttö uuden koostetun Orders-kyselyn luomiseen.