Wat is datawarehousing in Microsoft Fabric?
Van toepassing op:✅ SQL Analytics-eindpunt en -magazijn in Microsoft Fabric
Fabric Data Warehouse is een datawarehousingoplossing van de volgende generatie in Microsoft Fabric.
Het lake-centric warehouse is gebouwd op een gedistribueerde verwerkingsengine op bedrijfsniveau die toonaangevende prestaties op schaal mogelijk maakt en tegelijkertijd de behoefte aan configuratie en beheer minimaliseert. In de data lake wonen en ontworpen om systeemeigen ondersteuning te bieden voor open gegevensindelingen, maakt fabric-datawarehouse naadloze samenwerking mogelijk tussen data engineers en zakelijke gebruikers zonder afbreuk te doen aan beveiliging of governance.
De gebruiksvriendelijke SaaS-ervaring is ook nauw geïntegreerd met Power BI voor eenvoudige analyse en rapportage, het samenvoegen van de wereld van data lakes en magazijnen en het vereenvoudigen van een investering van organisaties in hun analyseomgeving.
Datawarehouse-klanten profiteren van:
- Gegevens die zijn opgeslagen in Delta Parquet-indeling maken ACID-transacties en interoperabiliteit met andere Fabric-workloads mogelijk, betekent dat u niet meerdere kopieën van gegevens nodig hebt.
- Query's voor meerdere databases kunnen meerdere gegevensbronnen gebruiken voor snelle inzichten met nul gegevensduplicatie.
- U kunt eenvoudig gegevens op schaal opnemen, laden en transformeren via pijplijnen, gegevensstromen, query's voor meerdere databases of de opdracht COPY INTO.
- Autonoom workloadbeheer met toonaangevende engine voor gedistribueerde queryverwerking betekent geen knoppen om te draaien om de beste prestaties te behalen.
- Schaal vrijwel onmiddellijk om te voldoen aan de bedrijfsbehoeften. Opslag en rekenkracht worden gescheiden.
- Beperkte tijd tot inzichten met een eenvoudig verbruikbaar, altijd verbonden semantisch model dat is geïntegreerd met Power BI in de Direct Lake-modus. Rapporten hebben altijd de meest recente gegevens voor analyse en rapportage.
- Gebouwd voor elk vaardigheidsniveau, van de burgerontwikkelaar tot DBA of data engineer.
Datawarehousingitems
Fabric Data Warehouse is geen traditioneel datawarehouse voor ondernemingen, het is een lakewarehouse dat ondersteuning biedt voor twee afzonderlijke magazijnitems: het datawarehouse fabric en het SQL-analyse-eindpunt. Beide zijn speciaal ontworpen om te voldoen aan de bedrijfsbehoeften van klanten, terwijl ze de beste prestaties leveren, de kosten minimaliseren en de administratieve overhead verminderen.
Fabric Data Warehouse
In een Microsoft Fabric-werkruimte wordt een Fabric-magazijn gelabeld als Warehouse in de kolom Type. Wanneer u de volledige mogelijkheden en transactionele mogelijkheden (DDL en DML-queryondersteuning) van een datawarehouse nodig hebt, is dit de snelle en eenvoudige oplossing voor u.
Het magazijn kan worden gevuld met een van de ondersteunde methoden voor gegevensopname, zoals COPY INTO, Pipelines, Dataflows of Cross Database-opnameopties, zoals CREATE TABLE AS SELECT (CTAS), INSERT.. SELECTEER OF SELECTEER IN.
Als u aan de slag wilt gaan met het magazijn, raadpleegt u:
SQL-analyse-eindpunt van Lakehouse
In een Microsoft Fabric-werkruimte heeft elk Lakehouse een automatisch gegenereerd SQL-analyse-eindpunt dat kan worden gebruikt om over te stappen van de Lake-weergave van Lakehouse (die data engineering en Apache Spark ondersteunt) naar de SQL-weergave van hetzelfde Lakehouse om weergaven, functies, opgeslagen procedures te maken en SQL-beveiliging toe te passen.
Met het SQL-analyse-eindpunt van Lakehouse kunnen T-SQL-opdrachten gegevensobjecten definiëren en opvragen, maar de gegevens niet bewerken of wijzigen. U kunt de volgende acties uitvoeren in het SQL Analytics-eindpunt:
- Voer een query uit op de tabellen die verwijzen naar gegevens in uw Delta Lake-mappen in het lake.
- Maak weergaven, inline-TVF's en procedures voor het inkapselen van uw semantiek en bedrijfslogica in T-SQL.
- Machtigingen voor de objecten beheren.
Als u aan de slag wilt gaan met het SQL Analytics-eindpunt, raadpleegt u:
- Beter samen: het lakehouse en magazijn in Microsoft Fabric
- Prestatieoverwegingen voor SQL Analytics-eindpunten
- Query's uitvoeren op het SQL Analytics-eindpunt of -warehouse in Microsoft Fabric
Magazijn of lakehouse
Bij het kiezen tussen het gebruik van een magazijn of lakehouse is het belangrijk om rekening te houden met de specifieke behoeften en context van uw vereisten voor gegevensbeheer en analyse. Even belangrijk, dit is geen enkele manier beslissing!
U hebt altijd de mogelijkheid om een of de andere op een later moment toe te voegen als de behoeften van uw bedrijf veranderen en ongeacht waar u begint, zowel het magazijn als het lakehouse dezelfde krachtige SQL-engine gebruiken voor alle T-SQL-query's.
Hier volgen enkele algemene richtlijnen om u te helpen bij het nemen van de beslissing:
Kies een datawarehouse wanneer u een oplossing op ondernemingsniveau nodig hebt met een open standaardindeling, geen knoppen en minimale installatie. Het datawarehouse is het meest geschikt voor semi-gestructureerde en gestructureerde gegevensindelingen en is geschikt voor zowel beginners als ervaren dataprofessionals, die eenvoudige en intuïtieve ervaringen bieden.
Kies een lakehouse wanneer u een grote opslagplaats met zeer ongestructureerde gegevens uit heterogene bronnen nodig hebt, waarbij gebruik wordt gemaakt van goedkope objectopslag en SPARK wilt gebruiken als uw primaire ontwikkelhulpprogramma. Als 'lichtgewicht' datawarehouse fungeert, hebt u altijd de mogelijkheid om het SQL-eindpunt en de T-SQL-hulpprogramma's te gebruiken om rapportage- en gegevensinformatiescenario's in uw lakehouse te leveren.
Zie de handleiding voor beslissingen van Microsoft Fabric: Kiezen tussen Warehouse en Lakehouse voor meer gedetailleerde richtlijnen voor beslissingen.