Dimensiomallintaminen Microsoft Fabric Warehousessa
Koskee:✅ SQL-analytiikan päätepiste ja Microsoft Fabric -varasto
Tämä artikkeli on ensimmäinen osa dimensiomallinnusta varaston sisällä. Se tarjoaa käytännön ohjeita Microsoft Fabric Warehouselle. Se on kokemus, joka tukee monia T-SQL-ominaisuuksia, kuten taulukoiden luomista ja tietojen hallintaa taulukoissa. Hallitset siis dimensiomallitaulukoiden luomista ja niiden lataamista tiedoilla.
Muistiinpano
Tässä artikkelissa termi tietovarasto viittaa yrityksen tietovarastoon, joka tarjoaa tärkeiden tietojen kattavan integroinnin koko organisaatioon. Sen sijaan erillinen termivarasto viittaa Fabric Warehouseen, joka on Ohjelmisto palveluna (SaaS) -relaatiotietokanta, jonka avulla voit toteuttaa tietovaraston. Selkeyden vuoksi tässä artikkelissa jälkimmäinen mainitaan nimellä Fabric Warehouse.
Vihje
Jos et ole aiemmin tutustunut dimensiomallinnusta, ota huomioon, että tämä artikkelisarja on ensimmäinen vaihe. Sen tarkoituksena ei ole käydä läpi koko dimensiomallinnuksen rakennetta. Lisätietoja on suoraan laajasti hyväksytyssä julkaistussa sisällössä, kuten The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3. painos, 2013), Ralph Kimball ja muut.
Tähtirakenteen suunnittelu
Tähtirakenne on dimensiomallinnuksen suunnittelutekniikka, joka on otettu käyttöön relaatiotietovarastoissa. Fabric Warehousea luotaessa kannattaa käyttää tätä suunnittelumenetelmää. Tähtirakenne koostuu faktataulukoista ja dimensiotaulukoista.
- Dimensiotaulukot kuvailevat entiteettejä, jotka liittyvät organisaatiosi ja analytiikan vaatimuksiin. Yleisesti ottaen ne edustavat asioita, joita mallinnat. Asiat voivat olla tuotteita, ihmisiä, paikkoja tai mitä tahansa muuta käsitettä, mukaan lukien päivämäärä ja aika. Lisätietoja ja suunnittelun parhaista käytännöistä on tämän sarjan Dimensiotaulukot-kohdassa .
- Faktataulukot tallentavat havaintoihin tai tapahtumiin liittyvät mittarit. Ne voivat tallentaa myyntitilauksia, varastosaldoja, valuuttakursseja, lämpötilalukemia ja paljon muuta. Faktataulukot sisältävät dimensioavaimia sekä eriytettyjä arvoja, jotka voidaan koostaa. Lisätietoja ja suunnittelun parhaat käytännöt ovat tämän sarjan faktataulukoiden kohdassa.
Tähtirakenne on optimoitu analytiikkakyselyjen kuormituksia varten. Tästä syystä sitä pidetään yrityksen Power BI - semanttisten mallien edellytyksenä. Analytiikkakyselyt koskevat tietojen suodatusta, ryhmittelyä, lajittelua ja yhteenvetoa. Faktatiedoista tehdään yhteenveto liittyvien dimensiotaulukoiden suodattimien ja ryhmittelyjen kontekstissa.
Syynä siihen, miksi sitä kutsutaan tähtirakenteeksi, on se, että faktataulukko muodostaa tähden keskipisteen, kun taas toisiinsa liittyvät dimensiotaulukot muodostavat tähden pisteet.
Tähtirakenne sisältää usein useita faktataulukoita, joten useita tähtiä.
Hyvin suunniteltu tähtirakenne tarjoaa suuren suorituskyvyn (relaatiokyselyt) pienempien taulukkoliitosten ja hyödyllisten indeksien suuremman todennäköisyyden vuoksi. Lisäksi tähtirakenne edellyttää usein vähäistä ylläpitoa tietovaraston rakenteen kehittyessä. Esimerkiksi uuden sarakkeen lisääminen dimensiotaulukkoon uuden määritteen analyysin tueksi on suhteellisen yksinkertainen tehtävä. Samoin uusien faktojen ja dimensioiden lisääminen tietovaraston laajuuden kehittyessä.
Dimensiomallin taulukot päivitetään ja ladataan säännöllisesti poiminta-, muunnos- ja latausprosessilla (ETL). Tämä prosessi synkronoi sen tiedot lähdejärjestelmiin, jotka tallentavat toiminnallisia tietoja. Lisätietoja on tämän sarjan kohdassa Taulukoiden lataaminen.
Power BI:n dimensiomallinnus
Yritysratkaisuissa Fabric Warehousen dimensiomalli on suositeltu edellytys Power BI: n semanttisen mallin luomiselle. Dimensiomalli ei ainoastaan tue semanttista mallia, vaan se on myös muiden kokemusten, kuten koneoppimismallien, tietojen lähde.
Se ei ehkä kuitenkaan tietyissä olosuhteissa ole paras vaihtoehto. Esimerkiksi itsepalveluanalyytikot, jotka tarvitsevat vapautta ja ketteryyttä toimiakseen nopeasti ja ilman riippuvuutta IT-toiminnosta, saattavat luoda semanttisia malleja, jotka muodostavat yhteyden suoraan lähdetietoihin. Tällaisissa tapauksissa dimensiomallinnuksen teorialla on yhä merkitystä. Teorian mukaan analyytikot voivat luoda intuitiivisia ja tehokkaita malleja sekä välttää dimensiomallin luomisen ja lataamisen tietovarastoon. Sen sijaan näennäisdimensioinen malli voidaan luoda käyttämällä Power Queryä, joka määrittää yhteyden muodostamislogiikan ja muuntaa lähdetiedot semanttisten mallitaulukoiden luomiseksi ja lataamiseksi. Lisätietoja on kohdassa Tutustu tähtirakenteeseen ja sen merkitykseen Power BI:ssä.
Tärkeä
Kun määrität dimensiomallin semanttisessa mallissa Power Queryn avulla, et pysty hallitsemaan historiallista muutosta, mikä saattaa olla tarpeen menneisyyden analysoimiseksi oikein. Jos tämä on välttämätöntä, luo tietovarasto ja anna kausittaisten ETL-prosessien siepata ja tallentaa dimension muutokset asianmukaisesti.
Tietovaraston suunnittelu
Ota tietovaraston luominen ja dimensiomallin rakenne vakavana ja tärkeänä yrityksenä. Tämä johtuu siitä, että tietovarasto on tietoympäristösi ydinosa. Sen tulisi muodostaa vakaa perusta, joka tukee analytiikkaa ja raportointia – ja siten päätöksentekoa – koko organisaatiolle.
Tätä varten tietovaraston tulee pyrkiä tallentamaan laatu, vaatimustenmukaiset ja historiallisesti tarkat tiedot yhdeksi versioksi totuudesta. Sen pitäisi tarjota ymmärrettävää ja siirtymiskelpoista tietoa nopealla suorituskyvyllä ja pakottaa käyttöoikeudet niin, että vain oikeat käyttäjät voivat käyttää oikeita tietoja. Pyri suunnittelemaan tietovarastosi resilienssin mahdollistamiseksi, jotta se mukautuu muutoksiin tarpeidesi kehittyessä.
Tietovaraston onnistunut toteutus riippuu hyvästä suunnittelusta. Lisätietoja strategisista ja taktisista seikoista sekä Fabricin ja tietovarastosi onnistuneeseen käyttöönottoon johtaneista toimintakohteista on Microsoft Fabricin käyttöönoton toteutussuunnitelman kohdassa.
Vihje
Suosittelemme, että luot yrityksen tietovaraston iteratiivisesti. Aloita ensin tärkeimmistä aihealueista ja laajenna sitten tietovarastoa muilla aihealueilla ajan mittaan prioriteetin ja resurssien mukaan.
Liittyvä sisältö
Tämän sarjan seuraavassa artikkelissa kerrotaan dimensiotaulukoiden ohjeista ja suunnittelusta.