Zelfstudie: Inleiding
Van toepassing op:✅ SQL Analytics-eindpunt en -magazijn in Microsoft Fabric
Microsoft Fabric biedt een one-stop shop voor alle analytische behoeften voor elke onderneming. Het omvat het volledige spectrum van services, waaronder gegevensverplaatsing, data lake, data engineering, gegevensintegratie en gegevenswetenschap, realtime analyses en business intelligence. Met Microsoft Fabric hoeft u geen verschillende services van meerdere leveranciers samen te voegen. In plaats daarvan geniet de klant van een end-to-end, zeer geïntegreerd, één uitgebreid product dat gemakkelijk te begrijpen, onboarden, maken en bedienen is. Geen ander product op de markt biedt de breedte, diepte en integratieniveau die Microsoft Fabric biedt. Daarnaast is Microsoft Purview standaard opgenomen in elke tenant om te voldoen aan de nalevings- en governancebehoeften.
Doel van deze zelfstudie
Hoewel veel concepten in Microsoft Fabric bekend zijn met gegevens- en analyseprofessionals, kan het lastig zijn om deze concepten toe te passen in een nieuwe omgeving. Deze zelfstudie is ontworpen om stapsgewijze instructies te volgen in een end-to-end scenario van gegevensverwerving tot gegevensverbruik om een basiskennis te creëren van de Microsoft Fabric-gebruikerservaring, de verschillende ervaringen en hun integratiepunten, en de professionele en burgerontwikkelaarservaring van Microsoft Fabric.
De zelfstudies zijn niet bedoeld als referentiearchitectuur, een uitgebreide lijst met functies en functionaliteit of een aanbeveling voor specifieke aanbevolen procedures.
End-to-end-scenario van datawarehouse
Voer de volgende stappen uit als vereisten voor deze zelfstudie:
- Meld u aan bij uw online Power BI-account of als u nog geen account hebt, meld u aan voor een gratis proefversie.
- Schakel Microsoft Fabric in uw tenant in.
In deze zelfstudie neemt u de rol van een warehouseontwikkelaar bij het fictieve bedrijf Wide World Importers over en voert u de volgende stappen uit in de Microsoft Fabric-portal om een end-to-end datawarehouse-oplossing te bouwen en te implementeren:
- Een werkruimte maken.
- Maak een magazijn.
- Gegevens opnemen van bron naar het dimensionale datawarehouse-model met een gegevenspijplijn.
- Tabellen maken met T-SQL- in uw warehouse.
- Gegevens laden met T-SQL met de SQL-queryeditor.
- Een tabel klonen met T-SQL- met de SQL-queryeditor.
- Gegevens transformeren met een opgeslagen procedure om geaggregeerde gegevenssets te maken.
- Tijdreizen met T-SQL- om gegevens te zien zoals deze op een bepaald moment worden weergegeven.
- Een query maken met de visualquery-editor om resultaten op te halen uit het datawarehouse.
- Gegevens in een notebook analyseren.
- een query voor meerdere warehouses maken en uitvoeren met SQL-query-editor.
- Een semantisch DirectLake-model en Power BI-rapport maken om de gegevens te analyseren.
- Een rapport genereren uit de OneLake-catalogus.
- zelfstudiebronnen opschonen door de werkruimte en andere items te verwijderen.
End-to-end-architectuur van datawarehouse
Gegevensbronnen - Met Microsoft Fabric kunt u eenvoudig en snel verbinding maken met Azure Data Services, andere cloudplatforms en on-premises gegevensbronnen om gegevens op te nemen.
Opname: met meer dan 200 systeemeigen connectors als onderdeel van de Microsoft Fabric-pijplijn en met slepen en neerzetten van gegevenstransformatie met gegevensstroom, kunt u snel inzichten voor uw organisatie opbouwen. Snelkoppeling is een nieuwe functie in Microsoft Fabric die een manier biedt om verbinding te maken met bestaande gegevens zonder deze te hoeven kopiëren of verplaatsen. Verderop in deze zelfstudie vindt u meer informatie over de functie Snelkoppeling.
Transformeren en opslaan : Microsoft Fabric standaardiseert de Delta Lake-indeling, wat betekent dat alle engines van Microsoft Fabric dezelfde gegevens kunnen lezen en bewerken die zijn opgeslagen in OneLake. U hoeft geen gegevens dupliciteit te gebruiken. Met deze opslag kunt u een datawarehouse of data mesh bouwen op basis van de behoeften van uw organisatie. Voor transformatie kunt u kiezen uit weinig code of geen code met pijplijnen/gegevensstromen of T-SQL gebruiken voor een eerste code-ervaring.
Verbruik: gegevens uit het magazijn kunnen worden gebruikt door Power BI, het toonaangevende business intelligence-hulpprogramma voor rapportage en visualisatie. Elk magazijn wordt geleverd met een ingebouwd TDS-eindpunt om eenvoudig verbinding te maken met en query's uit te voeren op gegevens uit andere rapportagehulpprogramma's, indien nodig. Wanneer een magazijn wordt gemaakt, wordt een secundair item, een standaard semantisch model genoemd, op hetzelfde moment gegenereerd met dezelfde naam. U kunt het standaard semantische model gebruiken om gegevens met slechts een paar stappen te visualiseren.
Voorbeeldgegevens
Voor voorbeeldgegevens gebruiken we de WWI-voorbeelddatabase (Wide World Importers). Voor ons end-to-end-scenario van het datawarehouse hebben we voldoende gegevens gegenereerd om een kijkje te nemen in de schaal- en prestatiemogelijkheden van het Microsoft Fabric-platform.
Wide World Importers (WWI) is een groothandel nieuwe goederenimporteur en distributeur die werkt vanuit de regio San Francisco Bay. Als groothandel zijn WWI's klanten meestal bedrijven die verkopen aan particulieren. WWI verkoopt aan retailklanten in de Verenigde Staten waaronder speciaalzaken, supermarkten, rekenwinkels, toeristische attractiewinkels en sommige personen. WWI verkoopt ook aan andere groothandels via een netwerk van agenten die de producten namens WWI promoten. Zie Wide World Importers-voorbeelddatabases voor Microsoft SQL voor meer informatie over hun bedrijfsprofiel en -werking.
Normaal gesproken brengt u gegevens van transactionele systemen (of line-of-business-toepassingen) naar een data lake of datawarehouse-faseringsgebied. Voor deze zelfstudie gebruiken we echter het dimensionale model dat door WWI wordt geleverd als onze initiële gegevensbron. We gebruiken deze als bron om de gegevens op te nemen in een datawarehouse en deze te transformeren via T-SQL.
Gegevensmodel
Hoewel het WWI-dimensionale model meerdere feitentabellen bevat, richten we ons voor deze zelfstudie alleen op de fact_sale
tabel en de bijbehorende dimensies, als volgt, om dit end-to-end datawarehouse-scenario te demonstreren: