Vad är datalagerhantering i Microsoft Fabric?
Gäller för:✅ SQL-analysslutpunkt och lager i Microsoft Fabric
Fabric Data Warehouse är en nästa generations datalagerlösning i Microsoft Fabric.
Det sjöcentrerade lagret bygger på en distribuerad bearbetningsmotor i företagsklass som möjliggör branschledande prestanda i stor skala samtidigt som behovet av konfiguration och hantering minimeras. Fabric-informationslagret finns i datasjön och har utformats för att internt stödja öppna dataformat och möjliggör sömlöst samarbete mellan datatekniker och företagsanvändare utan att äventyra säkerhet eller styrning.
Den lättanvända SaaS-upplevelsen är också nära integrerad med Power BI för enkel analys och rapportering, konvergera världen av datasjöar och lager och avsevärt förenkla en organisations investering i deras analysegendom.
Informationslagerkunder kan dra nytta av:
- Data som lagras i Delta-parquet-format möjliggör ACID-transaktioner och samverkan med andra Fabric-arbetsbelastningar innebär att du inte behöver flera kopior av data.
- Frågor mellan databaser kan använda flera datakällor för snabba insikter utan dataduplicering.
- Mata enkelt in, läsa in och transformera data i stor skala via Pipelines, Dataflöden, frågor mellan databaser eller KOMMANDOT KOPIERA TILL.
- Autonom arbetsbelastningshantering med branschledande distribuerad frågebearbetningsmotor innebär inga rattar att vända för att uppnå bästa prestanda i klassen.
- Skala nästan omedelbart för att uppfylla affärsbehoven. Lagring och beräkning separeras.
- Kortare tid till insikter med en lättansluten, alltid ansluten semantisk modell som är integrerad med Power BI i Direct Lake-läge. Rapporter har alltid de senaste data för analys och rapportering.
- Byggd för alla kompetensnivåer, från medborgarutvecklare till DBA eller datatekniker.
Datalagerobjekt
Fabric Data Warehouse är inte ett traditionellt informationslager för företag, det är ett lakelager som stöder två distinkta lagerartiklar: infrastrukturdatalagret och SQL-analysslutpunkten. Båda är specialbyggda för att uppfylla kundernas affärsbehov samtidigt som de ger bästa möjliga klassprestanda, minimerar kostnaderna och minskar de administrativa kostnaderna.
Infrastrukturdatalager
I en Microsoft Fabric-arbetsyta är ett Infrastrukturlager märkt som Lager i kolumnen Typ . När du behöver fullständig kraft och transaktionsfunktioner (DDL- och DML-frågestöd) för ett informationslager är detta den snabba och enkla lösningen för dig.
Informationslagret kan fyllas i med någon av de datainmatningsmetoder som stöds, till exempel KOPIERA TILL, Pipelines, Dataflöden eller alternativ för datainmatning mellan databaser, till exempel CREATE TABLE AS SELECT (CTAS), INSERT.. SELECT eller SELECT INTO.
Information om hur du kommer igång med informationslagret finns i:
SQL-analysslutpunkten för Lakehouse
På en Microsoft Fabric-arbetsyta har varje Lakehouse en automatiskt genererad "SQL-analysslutpunkt" som kan användas för att övergå från "Lake"-vyn för Lakehouse (som stöder datateknik och Apache Spark) till "SQL"-vyn för samma Lakehouse för att skapa vyer, funktioner, lagrade procedurer och tillämpa SQL-säkerhet.
Med SQL-analysslutpunkten för Lakehouse kan T-SQL-kommandon definiera och köra frågor mot dataobjekt men inte manipulera eller ändra data. Du kan utföra följande åtgärder i SQL-analysslutpunkten:
- Fråga tabellerna som refererar till data i dina Delta Lake-mappar i sjön.
- Skapa vyer, infogade TVF:er och procedurer för att kapsla in din semantik och affärslogik i T-SQL.
- Hantera behörigheter för objekten.
Information om hur du kommer igång med SQL-analysslutpunkten finns i:
- Bättre tillsammans: lakehouse och lager i Microsoft Fabric
- Prestandaöverväganden för SQL-analysslutpunkter
- Fråga SQL Analytics-slutpunkten eller informationslagret i Microsoft Fabric
Lager eller sjöhus
När du bestämmer dig för att använda ett lager eller ett sjöhus är det viktigt att tänka på de specifika behoven och kontexten för dina datahanterings- och analyskrav. Lika viktigt är att detta inte är ett enda sätt att fatta beslut!
Du har alltid möjlighet att lägga till det ena eller det andra vid ett senare tillfälle om dina affärsbehov ändras och oavsett var du startar använder både lagret och lakehouse samma kraftfulla SQL-motor för alla T-SQL-frågor.
Här följer några allmänna riktlinjer som hjälper dig att fatta beslutet:
Välj ett informationslager när du behöver en lösning i företagsskala med öppet standardformat, inga rattars prestanda och minimal konfiguration. Datalagret passar bäst för halvstrukturerade och strukturerade dataformat och är lämpligt för både nybörjare och erfarna dataexperter, vilket ger enkla och intuitiva upplevelser.
Välj ett sjöhus när du behöver en stor lagringsplats med mycket ostrukturerade data från heterogena källor, utnyttja lagring av billiga objekt och vill använda SPARK som primärt utvecklingsverktyg. Som ett "enkelt" informationslager har du alltid möjlighet att använda SQL-slutpunkten och T-SQL-verktygen för att leverera rapporterings- och datainformationsscenarier i ditt lakehouse.
Mer detaljerad beslutsvägledning finns i Beslutsguide för Microsoft Fabric: Välj mellan Warehouse och Lakehouse.