Inleiding tot datawarehouse-zelfstudie
Van toepassing op:✅ SQL Analytics-eindpunt en -magazijn in Microsoft Fabric
Microsoft Fabric biedt een one-stop shop voor alle analytische behoeften voor elke onderneming. Het omvat het volledige spectrum van services, waaronder gegevensverplaatsing, data lake, data engineering, gegevensintegratie en gegevenswetenschap, realtime analyses en business intelligence. Met Microsoft Fabric hoeft u geen verschillende services van meerdere leveranciers samen te voegen. In plaats daarvan geniet de klant van een end-to-end, zeer geïntegreerd, één uitgebreid product dat gemakkelijk te begrijpen, onboarden, maken en bedienen is. Geen ander product op de markt biedt de breedte, diepte en integratieniveau die Microsoft Fabric biedt. Daarnaast is Microsoft Purview standaard opgenomen in elke tenant om te voldoen aan de nalevings- en governancebehoeften.
Doel van deze zelfstudie
Hoewel veel concepten in Microsoft Fabric bekend zijn met gegevens- en analyseprofessionals, kan het lastig zijn om deze concepten toe te passen in een nieuwe omgeving. Deze zelfstudie is ontworpen om stapsgewijze instructies te volgen in een end-to-end scenario van gegevensverwerving tot gegevensverbruik om een basiskennis te creëren van de Microsoft Fabric-gebruikerservaring, de verschillende ervaringen en hun integratiepunten, en de professionele en burgerontwikkelaarservaring van Microsoft Fabric.
De zelfstudies zijn niet bedoeld als referentiearchitectuur, een uitgebreide lijst met functies en functionaliteit of een aanbeveling voor specifieke aanbevolen procedures.
End-to-end-scenario van datawarehouse
Voer de volgende stappen uit als vereisten voor deze zelfstudie:
- Meld u aan bij uw online Power BI-account of als u nog geen account hebt, meld u aan voor een gratis proefversie.
- Schakel Microsoft Fabric in uw tenant in.
In deze zelfstudie neemt u de rol van een warehouseontwikkelaar bij het fictieve bedrijf Wide World Importers over en voert u de volgende stappen uit in de Microsoft Fabric-portal om een end-to-end datawarehouse-oplossing te bouwen en te implementeren:
- Maak een Microsoft Fabric-werkruimte.
- Maak een magazijn.
- Gegevens opnemen van bron naar het dimensionale datawarehouse-model met een gegevenspijplijn.
- Tabellen maken in uw magazijn.
- Gegevens laden met T-SQL met de SQL-queryeditor.
- Kloon een tabel met behulp van T-SQL met de SQL-queryeditor.
- Transformeer de gegevens om geaggregeerde gegevenssets te maken met behulp van T-SQL.
- Tijdreizen met behulp van T-SQL om gegevens te zien zoals deze worden weergegeven.
- Gebruik de visualquery-editor om een query uit te voeren op het datawarehouse.
- Gegevens analyseren met een notebook.
- Query's tussen magazijnen maken en uitvoeren met SQL-query-editor.
- Maak Power BI-rapporten met de DirectLake-modus om de gegevens te analyseren.
- Een rapport maken vanuit OneLake.
- Schoon resources op door de werkruimte en andere items te verwijderen.
End-to-end-architectuur van datawarehouse
Gegevensbronnen - Met Microsoft Fabric kunt u eenvoudig en snel verbinding maken met Azure Data Services, andere cloudplatforms en on-premises gegevensbronnen om gegevens op te nemen.
Opname: met meer dan 200 systeemeigen connectors als onderdeel van de Microsoft Fabric-pijplijn en met slepen en neerzetten van gegevenstransformatie met gegevensstroom, kunt u snel inzichten voor uw organisatie opbouwen. Snelkoppeling is een nieuwe functie in Microsoft Fabric die een manier biedt om verbinding te maken met bestaande gegevens zonder deze te hoeven kopiëren of verplaatsen. Verderop in deze zelfstudie vindt u meer informatie over de functie Snelkoppeling.
Transformeren en opslaan : Microsoft Fabric standaardiseert de Delta Lake-indeling, wat betekent dat alle engines van Microsoft Fabric dezelfde gegevens kunnen lezen en bewerken die zijn opgeslagen in OneLake. U hoeft geen gegevens dupliciteit te gebruiken. Met deze opslag kunt u een datawarehouse of data mesh bouwen op basis van de behoeften van uw organisatie. Voor transformatie kunt u kiezen uit weinig code of geen code met pijplijnen/gegevensstromen of T-SQL gebruiken voor een eerste code-ervaring.
Verbruik: gegevens uit het magazijn kunnen worden gebruikt door Power BI, het toonaangevende business intelligence-hulpprogramma voor rapportage en visualisatie. Elk magazijn wordt geleverd met een ingebouwd TDS-eindpunt om eenvoudig verbinding te maken met en query's uit te voeren op gegevens uit andere rapportagehulpprogramma's, indien nodig. Wanneer een magazijn wordt gemaakt, wordt een secundair item, een standaard semantisch model genoemd, op hetzelfde moment gegenereerd met dezelfde naam. U kunt het standaard semantische model gebruiken om gegevens met slechts een paar stappen te visualiseren.
Voorbeeldgegevens
Voor voorbeeldgegevens gebruiken we de WWI-voorbeelddatabase (Wide World Importers). Voor ons end-to-end-scenario van het datawarehouse hebben we voldoende gegevens gegenereerd om een kijkje te nemen in de schaal- en prestatiemogelijkheden van het Microsoft Fabric-platform.
Wide World Importers (WWI) is een groothandel nieuwe goederenimporteur en distributeur die werkt vanuit de regio San Francisco Bay. Als groothandel zijn WWI's klanten meestal bedrijven die verkopen aan particulieren. WWI verkoopt aan retailklanten in de Verenigde Staten waaronder speciaalzaken, supermarkten, rekenwinkels, toeristische attractiewinkels en sommige personen. WWI verkoopt ook aan andere groothandels via een netwerk van agenten die de producten namens WWI promoten. Zie Wide World Importers-voorbeelddatabases voor Microsoft SQL voor meer informatie over hun bedrijfsprofiel en -werking.
Normaal gesproken brengt u gegevens van transactionele systemen (of line-of-business-toepassingen) naar een data lake of datawarehouse-faseringsgebied. Voor deze zelfstudie gebruiken we echter het dimensionale model dat door WWI wordt geleverd als onze initiële gegevensbron. We gebruiken deze als bron om de gegevens op te nemen in een datawarehouse en deze te transformeren via T-SQL.
Gegevensmodel
Hoewel het WWI-dimensionale model meerdere feitentabellen bevat, richten we ons voor deze zelfstudie alleen op de fact_sale
tabel en de bijbehorende dimensies, als volgt, om dit end-to-end datawarehouse-scenario te demonstreren: