Del via


Selvstudium: Introduktion

Gælder for:✅ SQL Analytics-slutpunkt og warehouse i Microsoft Fabric

Microsoft Fabric leverer en one-stop-shop til alle de analytiske behov for hver virksomhed. Den dækker hele spektret af tjenester, herunder dataflytning, data lake, datakonstruktion, dataintegration og datavidenskab, analyse i realtid og business intelligence. Med Microsoft Fabric er der ingen grund til at sy forskellige tjenester fra flere leverandører sammen. Kunden nyder i stedet et komplet, yderst integreret, enkelt omfattende produkt, der er let at forstå, onboarde, oprette og betjene. Intet andet produkt på markedet tilbyder den bredde, dybde og grad af integration, som Microsoft Fabric tilbyder. Derudover er Microsoft Purview som standard inkluderet i alle lejere for at opfylde kravene til overholdelse og styring.

Formålet med dette selvstudium

Selvom mange begreber i Microsoft Fabric kan være velkendte for data- og analyseteknikere, kan det være en udfordring at anvende disse begreber i et nyt miljø. Dette selvstudium er designet til at gennemgå en trinvis gennemgang af et scenarie fra dataanskaffelse til dataforbrug for at skabe en grundlæggende forståelse af Microsoft Fabric-brugeroplevelsen, de forskellige oplevelser og deres integrationspunkter samt udvikleroplevelserne for Microsoft Fabric og borgere.

Selvstudierne er ikke beregnet til at være en referencearkitektur, en udtømmende liste over funktioner og funktionalitet eller en anbefaling af specifikke bedste fremgangsmåder.

Slutscenarie for data warehouse

Som forudsætninger for dette selvstudium skal du udføre følgende trin:

  1. Log på din Power BI-onlinekonto, eller hvis du endnu ikke har en konto, kan du tilmelde dig en gratis prøveversion.
  2. Aktivér Microsoft Fabric i din lejer.

I dette selvstudium påtager du dig rollen som lagerudvikler i den fiktive virksomhed Wide World Importers og fuldfører følgende trin i Microsoft Fabric-portalen for at oprette og implementere en komplet data warehouse-løsning:

  1. Opret et arbejdsområde.
  2. Opret et lager.
  3. Indfødning af data fra kilde til dimensionsmodel for data warehouse med en datapipeline.
  4. Opret tabeller med T-SQL- i dit lager.
  5. Indlæs data med T-SQL med SQL-forespørgselseditoren.
  6. Klon en tabel med T-SQL- med SQL-forespørgselseditoren.
  7. Transformer data med en lagret procedure til at oprette aggregerede datasæt.
  8. Tidsrejse med T-SQL- for at se data, som de blev vist på et tidspunkt.
  9. Opret en forespørgsel med den visuelle forespørgselseditor for at hente resultater fra data warehouse.
  10. Analysér data i en notesbog.
  11. Opret og udfør en forespørgsel på tværs af lageret med SQL-forespørgselseditor.
  12. Opret en semantisk DirectLake-model og en Power BI-rapport til at analysere de eksisterende data.
  13. Generér en rapport fra OneLake-kataloget.
  14. Rydde op i selvstudieressourcer ved at slette arbejdsområdet og andre elementer.

Data warehouse end-to-end-arkitektur

Diagram, der viser data warehouse-arkitekturen fra ende til anden.

Datakilder – Microsoft Fabric gør det nemt og hurtigt at oprette forbindelse til Azure Data Services, andre cloudplatforme og datakilder i det lokale miljø for at hente data fra.

Indtagelse – Med mere end 200 oprindelige connectors som en del af Microsoft Fabric-pipelinen og med træk og slip-datatransformation med dataflow kan du hurtigt opbygge indsigt til din organisation. Genvej er en ny funktion i Microsoft Fabric, der giver dig mulighed for at oprette forbindelse til eksisterende data uden at skulle kopiere eller flytte dem. Du kan finde flere oplysninger om genvejsfunktionen senere i dette selvstudium.

Transformér og gem – Microsoft Fabric standardiserer Delta Lake-formatet, hvilket betyder, at alle programmerne i Microsoft Fabric kan læse og arbejde med de samme data, der er gemt i OneLake – intet behov for dataduplicitet. Dette lager giver dig mulighed for at bygge et data warehouse eller datanet baseret på dine organisatoriske behov. I forbindelse med transformation kan du enten vælge en oplevelse med lav kode eller ingen kode med pipelines/dataflows eller bruge T-SQL til en første kodeoplevelse.

Forbrug – Data fra lageret kan bruges af Power BI, som er branchens førende business intelligence-værktøj, til rapportering og visualisering. Hvert lager leveres med et indbygget TDS-slutpunkt, så du nemt kan oprette forbindelse til og forespørge om data fra andre rapporteringsværktøjer, når det er nødvendigt. Når der oprettes et lager, genereres der et sekundært element, der kaldes en semantisk standardmodel, samtidig med det samme navn. Du kan bruge den semantiske standardmodel til at begynde at visualisere data med blot et par trin.

Eksempeldata

I forbindelse med eksempeldata bruger vi eksempeldatabasen Wide World Importers (WWI). I forbindelse med vores data warehouse end-to-end-scenarie har vi genereret tilstrækkelige data til et smugkig på skalerings- og ydeevnefunktionerne på Microsoft Fabric-platformen.

Wide World Importers (WWI) er en engros nyhedsvareimportør og -distributør, der opererer fra San Francisco Bay-området. Som grossist er WWI's kunder hovedsageligt virksomheder, der videresælger til enkeltpersoner. WWI sælger til detailkunder på tværs af USA herunder specialbutikker, supermarkeder, databehandlingsbutikker, turistattraktionsbutikker og nogle enkeltpersoner. WWI sælger også til andre grossister via et netværk af agenter, der markedsfører produkterne på WWI's vegne. Hvis du vil have mere at vide om virksomhedens profil og drift, skal du se Eksempeldatabaser for Wide World Importers til Microsoft SQL.

Du vil typisk overføre data fra transaktionssystemer (eller line of business-programmer) til et midlertidigt data lake- eller data warehouse-område. Men i dette selvstudium bruger vi den dimensionelle model, der leveres af WWI, som vores oprindelige datakilde. Vi bruger dem som kilde til at indføde dataene i et data warehouse og transformere dem via T-SQL.

Datamodel

Mens WWI-dimensionelle modeller indeholder flere faktatabeller, fokuserer vi i dette selvstudium kun på tabellen og dens fact_sale relaterede dimensioner på følgende måde for at vise dette scenarie fra slutpunkt til slutpunkt for data warehouse:

Diagram, der viser den datamodel, du bruger i dette selvstudium, som omfatter tabellen fact_sale og dens relaterede dimensioner.

Næste trin