Hvad er Spejling i Fabric?
Spejling i Fabric er en billig løsning med lav ventetid, der samler data fra forskellige systemer til en enkelt analyseplatform. Du kan løbende replikere dit eksisterende dataområde direkte til Fabric's OneLake fra en række Azure-databaser og eksterne datakilder.
Med de mest opdaterede data i et format, der kan forespørges i OneLake, kan du nu bruge alle de forskellige tjenester i Fabric, f.eks. kørsel af analyser med Spark, udførelse af notesbøger, datakonstruktion, visualisering via Power BI-rapporter og meget mere.
Spejling i Fabric giver brugerne mulighed for at nyde godt af et yderst integreret, brugervenligt produkt, der er designet til at forenkle dine analysebehov. Mirroring er bygget til åbenhed og samarbejde mellem Microsoft og teknologiløsninger, der kan læse delta Lake-tabelformatet med åben kildekode, og er en nøglefærdig løsning med lave omkostninger og ventetid, der giver dig mulighed for at oprette en replika af dine data i OneLake, som kan bruges til alle dine analytiske behov.
Delta-tabellerne kan derefter bruges overalt, så brugerne kan sætte fart på deres rejse ind i Fabric.
Hvorfor bruge Spejling i Fabric?
I dag har mange organisationer missionskritiske drifts- eller analysedata, der sidder i siloer.
Adgang til og arbejde med disse data i dag kræver komplekse ETL-pipelines (Extract Transform Load), forretningsprocesser og beslutningssiloer, hvilket skaber:
- Begrænset og begrænset adgang til vigtige data, der ændres hele tiden
- Friktion mellem mennesker, processer og teknologi
- Lange ventetider for oprettelse af datapipelines og -processer til vigtige data
- Ingen frihed til at bruge de værktøjer, du har brug for til at analysere og dele indsigt komfortabelt
- Mangel på et ordentligt grundlag for folk at dele og samarbejde om data
- Ingen almindelige, åbne dataformater til alle analysescenarier – BI, AI, Integration, Engineering og endda Apps
Mirroring in Fabric giver en nem oplevelse, hvor du hurtigt kan sætte fart på den tid, du skal bruge for at få indsigt og beslutninger, og for at opdele datasiloer mellem teknologiløsninger:
- Replikering af data og metadata i nær realtid til en SaaS-datasø med indbygget analyse til BI og AI
Microsoft Fabric-platformen er bygget på et fundament af SaaS (Software as a Service), som tager enkelhed og integration til et helt nyt niveau. Du kan få mere at vide om Microsoft Fabric under Hvad er Microsoft Fabric?
Spejling opretter tre elementer i dit Fabric-arbejdsområde:
- Spejling administrerer replikering af data og metadata til OneLake og konvertering til Parquet i et format, der er klar til analyse. Dette muliggør downstreamscenarier, f.eks. datakonstruktion, datavidenskab og meget mere.
- Et SQL Analytics-slutpunkt
- En semantisk standardmodel
Ud over SQL-forespørgselseditoren er der et bredt økosystem af værktøjer, herunder SQL Server Management Studio (SSMS), mssql-udvidelsen med Visual Studio Code og endda GitHub Copilot.
Deling gør det nemmere at styre og administrere adgang for at sikre, at du kan styre adgangen til følsomme oplysninger. Deling gør det også muligt at træffe sikre og demokratiserede beslutninger på tværs af organisationen.
Spejlingstyper
Fabric tilbyder tre forskellige metoder til at hente data ind i OneLake via spejling.
- Databasespejling – Databasespejling i Microsoft Fabric gør det muligt at replikere hele databaser og tabeller, så du kan samle data fra forskellige systemer til en enkelt analyseplatform.
- Metadataspejling – metadataspejling i Fabric synkroniserer metadata (f.eks. katalognavne, skemaer og tabeller) i stedet for fysisk at flytte dataene. Denne fremgangsmåde udnytter genveje og sikrer, at dataene forbliver i kilden, samtidig med at de stadig er let tilgængelige i Fabric.
- Åben spejling – Åben spejling i Fabric er designet til at udvide spejling baseret på åbent Delta Lake-tabelformat. Denne funktion gør det muligt for alle udviklere at skrive deres programs ændringsdata direkte til et spejlet databaseelement i Microsoft Fabric baseret på den åbne spejlingstilgang og offentlige API'er.
I øjeblikket er følgende eksterne databaser tilgængelige:
Platform | Replikering i nærheden af realtid | Spejlingstype | Selvstudium fra ende til anden |
---|---|---|---|
Spejlede Microsoft Fabric-databaser fra Azure Cosmos DB (prøveversion) | Ja | Databasespejling | Selvstudium: Azure Cosmos DB |
Spejlede Microsoft Fabric-databaser fra Azure Databricks (prøveversion) | Ja | Spejling af metadata | Selvstudium: Azure Databricks |
Spejlede Microsoft Fabric-databaser fra Azure SQL Database | Ja | Databasespejling | Selvstudium: Azure SQL Database |
Spejlede Microsoft Fabric-databaser fra Azure SQL Managed Instance (prøveversion) | Ja | Databasespejling | Selvstudium: Azure SQL Managed Instance |
Spejlede Microsoft Fabric-databaser fra Snowflake | Ja | Databasespejling | Selvstudium: Snowflake |
Åbn spejlede databaser (prøveversion) | Ja | Åbn spejling | Selvstudium: Åbn spejling |
Spejlede Microsoft Fabric-databaser fra Fabric SQL-database (prøveversion) | Ja | Databasespejling | Automatisk konfigureret |
Hvordan fungerer replikering af databasespejling i realtid?
Spejling er aktiveret ved at oprette en sikker forbindelse til din driftsmæssige datakilde. Du vælger, om du vil replikere en hel database eller individuelle tabeller, og Spejling vil automatisk holde dine data synkroniseret. Når dataene er konfigureret, replikeres de løbende til OneLake til analyseforbrug.
Følgende er kerneprincipperne for spejling:
Aktivering af Spejling i Fabric er enkel og intuitiv, uden at det er nødvendigt at oprette komplekse ETL-pipelines, tildele andre beregningsressourcer og administrere dataflytning.
Spejling i Fabric er en fuldt administreret tjeneste, så du behøver ikke at bekymre dig om at hoste, vedligeholde eller administrere replikering af den spejlede forbindelse.
Hvordan fungerer spejling af metadata?
Spejling muliggør ikke kun datareplikering, men kan også opnås via genveje eller metadataspejling i stedet for fuld datareplikering, så data kan være tilgængelige uden fysisk at flytte eller duplikere dem. Spejling i denne kontekst refererer til replikering af kun metadata – f.eks. katalognavne, skemaer og tabeller – i stedet for selve dataene. Denne fremgangsmåde gør det muligt for Fabric at gøre data fra forskellige kilder tilgængelige uden at duplikere dem, forenkle dataadministrationen og minimere lagerbehov.
Når du f.eks. får adgang til data, der er registreret i Unity Catalog, afspejler Fabric kun katalogstrukturen fra Azure Databricks, hvilket gør det muligt at få adgang til de underliggende data via genveje. Denne metode sikrer, at ændringer i kildedataene straks afspejles i Fabric uden at kræve dataflytning, vedligeholdelse af synkronisering i realtid og forbedret effektivitet i forbindelse med adgang til opdaterede oplysninger.
Hvordan fungerer åben spejling?
Ud over at spejle aktivering af datareplikering ved at oprette en sikker forbindelse til datakilden kan du også vælge en eksisterende dataprovider eller skrive dit eget program for at lande data i en spejlet database. Når du har oprettet en åben spejlet database via en offentlig API eller via Fabric-portalen, kan du få en URL-adresse til landingszonen i OneLake, hvor du kan lande ændringsdata pr. åben spejlingsspecifikation.
Når dataene er i landingszonen med det korrekte format, begynder replikeringen at køre og administrere kompleksiteten af at flette ændringerne med opdateringer, indsætte og slette, så de afspejles i deltatabeller. Denne metode sikrer, at alle data, der skrives i landingszonen, bliver opdateret med det samme og holder dataene i Fabric opdateret.
Deling
Deling gør det nemmere at styre og administrere adgang, mens sikkerhedskontrolelementer som sikkerhed på rækkeniveau (RLS) og sikkerhed på objektniveau (OLS) og mere sørg for, at du kan styre adgangen til følsomme oplysninger. Deling gør det også muligt at træffe sikre og demokratiserede beslutninger på tværs af organisationen.
Ved at dele giver brugerne andre brugere eller en gruppe brugere adgang til en spejlet database uden at give adgang til arbejdsområdet og resten af dets elementer. Når nogen deler en spejlet database, giver de også adgang til SQL-analyseslutpunktet og den tilknyttede semantiske standardmodel.
Du kan få flere oplysninger under Del din spejlede database, og administrer tilladelser.
Forespørgsler på tværs af databaser
Når dataene fra din spejlede database er gemt i OneLake, kan du skrive forespørgsler på tværs af databaser og samle data fra spejlede databaser, lagre og SQL-analyseslutpunkter for Lakehouses i en enkelt T-SQL-forespørgsel. Du kan få flere oplysninger under Skriv en forespørgsel på tværs af databaser.
Du kan f.eks. referere til tabellen fra spejlede databaser og lagre ved hjælp af navngivning i tre dele. I følgende eksempel skal du bruge navnet på tre dele til at referere til ContosoSalesTable
på lageret ContosoWarehouse
. Fra andre databaser eller lagre er den første del af standard-SQL-navngivningskonventionen med tre dele navnet på den spejlede database.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Dataudvikler med dine spejlede databasedata
Microsoft Fabric indeholder forskellige datatekniske funktioner, der sikrer, at dine data er let tilgængelige, velorganiserede og i høj kvalitet. Fra Fabric Dataudvikler ing kan du:
- Opret og administrer dine data som Spark ved hjælp af et lakehouse
- Design pipelines til kopiering af data til dit lakehouse
- Brug Spark-jobdefinitioner til at sende batch-/streamingjob til Spark-klyngen
- Brug notesbøger til at skrive kode til dataindtagelse, forberedelse og transformation
Datavidenskab med dine spejlede databasedata
Microsoft Fabric tilbyder Fabric Data Science for at gøre det muligt for brugerne at fuldføre komplette datavidenskabsarbejdsprocesser med henblik på databerigelse og forretningsindsigt. Du kan udføre en lang række aktiviteter på tværs af hele datavidenskabsprocessen lige fra udforskning af data, forberedelse og rensning til eksperimentering, modellering, modelscore og visning af forudsigende indsigt i BI-rapporter.
Microsoft Fabric-brugere kan få adgang til datavidenskabsarbejdsbelastninger. Herfra kan de finde og få adgang til forskellige relevante ressourcer. De kan f.eks. oprette eksperimenter med maskinel indlæring, modeller og notesbøger. De kan også importere eksisterende notesbøger på startsiden for datavidenskab.
SQL-database i Fabric
Du kan også oprette og administrere en SQL-database direkte i Microsoft Fabric (Preview) på Fabric-portalen. Baseret på Azure SQL Database afspejles SQL-databasen i Fabric automatisk til analyseformål og giver dig mulighed for nemt at oprette din driftsmæssige database i Fabric. SQL-databasen er hjemsted i Fabric til OLTP-arbejdsbelastninger og kan integreres med Fabric's integration af kildestyring.