Spejling af Azure Cosmos DB (prøveversion)
Spejling i Microsoft Fabric giver en problemfri no-ETL-oplevelse, så du kan integrere dine eksisterende Azure Cosmos DB-data med resten af dine data i Microsoft Fabric. Dine Azure Cosmos DB-data replikeres løbende direkte til Fabric OneLake i næsten realtid uden nogen indvirkning på ydeevnen på dine transaktionsarbejdsbelastninger eller forbrugende anmodningsenheder ( RU'er).
Data i OneLake gemmes i deltaformatet med åben kildekode og gøres automatisk tilgængelige for alle analysemotorer på Fabric.
Du kan bruge indbyggede Power BI-funktioner til at få adgang til data i OneLake i DirectLake-tilstand. Med Copilot forbedringer i Fabric kan du bruge styrken ved generativ AI til at få vigtig indsigt i dine forretningsdata. Ud over Power BI kan du bruge T-SQL til at køre komplekse aggregerede forespørgsler eller bruge Spark til dataudforskning. Du kan problemfrit få adgang til dataene i notesbøger og bruge datavidenskab til at bygge modeller til maskinel indlæring.
Vigtigt
Spejling til Azure Cosmos DB er i øjeblikket en prøveversion. Produktionsarbejdsbelastninger understøttes ikke under prøveversionen. I øjeblikket understøttes kun Azure Cosmos DB for NoSQL-konti.
Hvorfor bruge spejling i Fabric?
Med Mirroring i Fabric behøver du ikke at samle forskellige tjenester fra flere leverandører. I stedet kan du nyde godt af et yderst integreret, færdigt og brugervenligt produkt, der er designet til at forenkle dine analysebehov og udviklet til åbenhed.
Hvis du leder efter BI-rapportering eller -analyse af dine driftsdata i Azure Cosmos DB, indeholder spejling:
- No-ETL, omkostningseffektiv næsten realtidsadgang til dine Azure Cosmos DB-data uden at foretage dit enhedsforbrug af din anmodning
- Let at overføre data på tværs af forskellige kilder til Fabric OneLake
- Delta-tabeloptimeringer med v-rækkefølge til lynhurtige læsninger
- Integration med et enkelt klik med Power BI med Direct Lake og Copilot
- Omfattende forretningsindsigt ved at samle data på tværs af forskellige kilder
- Bedre appintegration for at få adgang til forespørgsler og visninger
OneLake-data gemmes i Delta Lake-formatet med åben kildekode, så du kan bruge dem med forskellige løsninger i og uden for Microsoft. Dette dataformat hjælper med at gøre det nemmere at bygge en enkelt dataejendom til dine analytiske behov.
Hvilke analyseoplevelser er indbygget?
Spejlede databaser er et element i Fabric Data Warehousing, der adskiller sig fra slutpunktet for Warehouse og SQL Analytics.
Alle spejlede Azure Cosmos DB-databaser indeholder tre elementer, du kan interagere med i dit Fabric-arbejdsområde:
- Det spejlede databaseelement. Spejling administrerer replikering af data til OneLake og konvertering til Parquet i et format, der er klar til analyse. Dette muliggør downstreamscenarier, f.eks. datakonstruktion, datavidenskab og meget mere.
- SQL-analyseslutpunkt, som genereres automatisk
- Standard semantisk model, som genereres automatisk
Spejlet database
Den spejlede database viser replikeringsstatus og de kontrolelementer, der skal stoppe eller starte replikering i Fabric OneLake. Du kan også få vist din kildedatabase i skrivebeskyttet tilstand ved hjælp af Azure Cosmos DB-dataoversigten. Ved hjælp af Data Explorer kan du få vist dine objektbeholdere i din kilde Azure Cosmos DB-database og forespørge dem. Disse handlinger bruger anmodningsenheder fra din Azure Cosmos DB-konto. Eventuelle ændringer af kildedatabasen afspejles straks i Fabric's kildedatabasevisning. Det er ikke tilladt at skrive til kildedatabasen fra Fabric, da du kun kan få vist dataene.
SQL Analytics-slutpunkt
Hver spejlede database har et automatisk genereret SQL-analyseslutpunkt, der giver en omfattende analyseoplevelse oven på OneLakes Delta-tabeller, der er oprettet af spejlingsprocessen. Du har adgang til velkendte T-SQL-kommandoer, der kan definere og forespørge om dataobjekter, men ikke manipulere dataene fra SQL-analyseslutpunktet, da det er en skrivebeskyttet kopi.
Du kan udføre følgende handlinger i SQL Analytics-slutpunktet:
- Udforsk Delta Lake-tabeller ved hjælp af T-SQL. Hver tabel er knyttet til en objektbeholder fra din Azure Cosmos DB-database.
- Opret forespørgsler og visninger uden kode, og udforsk dem visuelt uden at skrive en kodelinje.
- Joinforbind og forespørg om data i andre spejlede databaser, lagre og Lakehouses i det samme arbejdsområde.
- Du kan nemt visualisere og oprette BI-rapporter baseret på SQL-forespørgsler eller -visninger.
Ud over SQL-forespørgselseditoren er der et bredt økosystem af værktøjer. Disse værktøjer omfatter mssql-udvidelsen med Visual Studio Code, SQL Server Management Studio (SSMS) og endda GitHub Copilot. Du kan kompresse analyse og indsigtsgenerering ud fra det værktøj, du vælger.
Semantisk model
Den semantiske standardmodel er en automatisk klargjort Semantisk Power BI-model. Denne funktion gør det muligt at oprette, dele og genbruge forretningsmetrik. Du kan få flere oplysninger under semantiske modeller.
Hvordan fungerer replikering i næsten realtid?
Når du aktiverer spejling på din Azure Cosmos DB-database, indsættes, opdateres og slettes handlinger på dine OLTP-data (online transaction processing) løbende replikeres til Fabric OneLake til analyseforbrug.
Funktionen til kontinuerlig sikkerhedskopiering er en forudsætning for spejling. Du kan aktivere enten 7-dages eller 30-dages kontinuerlig sikkerhedskopiering på din Azure Cosmos DB-konto. Hvis du aktiverer kontinuerlig sikkerhedskopiering specifikt til spejling, anbefales 7-dages kontinuerlig sikkerhedskopiering, da det er gratis.
Bemærk
Spejling bruger ikke Azure Cosmos DB's analyselager eller ændringsfeed som en kilde til hentning af ændringsdata. Du kan fortsætte med at bruge disse funktioner uafhængigt af hinanden sammen med spejling.
Det kan tage et par minutter at replikere dine Azure Cosmos DB-data til Fabric OneLake. Afhængigt af dine datas indledende snapshot eller hyppigheden af opdateringer/sletninger kan replikering også tage længere tid i nogle tilfælde. Replikering påvirker ikke de anmodningsenheder (RU'er), du har allokeret til dine transaktionsarbejdsbelastninger.
Hvad du kan forvente af spejling
Der er et par overvejelser og understøttede scenarier, du bør overveje, før du spejler.
Overvejelser i forbindelse med konfiguration
Hvis du vil spejle en database, skal den allerede klargøres i Azure. Du skal aktivere fortløbende sikkerhedskopiering af kontoen som en forudsætning.
- Du kan kun spejle hver database enkeltvist ad gangen. Du kan vælge, hvilken database der skal spejles.
- Du kan spejle den samme database flere gange i det samme arbejdsområde. Som bedste praksis kan en enkelt kopi af databasen genbruges på tværs af lakehouses, lagre eller andre spejlede databaser. Du behøver ikke at konfigurere flere spejle til den samme database.
- Du kan også spejle den samme database på tværs af forskellige Fabric-arbejdsområder eller -lejere.
- Ændringer af Azure Cosmos DB-objektbeholdere, f.eks. tilføjelse af nye objektbeholdere og sletning af eksisterende objektbeholdere, replikeres problemfrit til Fabric. Du kan f.eks. begynde at spejle en tom database uden objektbeholdere, og hvis du spejler, hentes de objektbeholdere, der tilføjes på et senere tidspunkt.
Understøttelse af indlejrede data
Indlejrede data vises som en JSON-streng i SQL Analytics-slutpunktstabeller. Du kan bruge OPENJSON
, CROSS APPLY
og OUTER APPLY
i T-SQL-forespørgsler eller -visninger til at udvide disse data selektivt. Hvis du bruger Power Query, kan du også anvende funktionen ToJson
til at udvide disse data.
Bemærk
Fabric har en begrænsning for strengkolonner på 8 KB. Du kan få flere oplysninger under Begrænsninger for data warehouse.
Håndter skemaændringer
Spejling replikerer automatisk egenskaber på tværs af Azure Cosmos DB-elementer med skemaændringer. Alle nye egenskaber, der registreres i et element, vises som nye kolonner, og de manglende egenskaber repræsenteres som null i Fabric.
Hvis du omdøber en egenskab i et element, bevarer Fabric-tabeller både de gamle og nye kolonner. Den gamle kolonne viser null, og den nye viser den seneste værdi for alle elementer, der replikeres efter omdøbningshandlingen.
Hvis du ændrer datatypen for en egenskab i Azure Cosmos DB-elementer, understøttes ændringerne for kompatible datatyper, der kan konverteres. Hvis datatyperne ikke er kompatible til konvertering i Delta, vises de som null-værdier.
SQL Analytics-slutpunktstabeller konverterer Delta-datatyper til T-SQL-datatyper.
Duplikerede kolonnenavne
Azure Cosmos DB understøtter kolonnenavne, hvor der ikke skelnes mellem store og små bogstaver, baseret på JSON-standarden. Spejling understøtter disse duplikerede kolonnenavne ved at føje _n
til kolonnenavnet, hvor n
ville være en numerisk værdi.
Hvis Azure Cosmos DB-elementet f.eks. har addressName
og AddressName
som entydige egenskaber, har Fabric-tabeller tilsvarende addressName
og AddressName_1
kolonner. Du kan få flere oplysninger under replikeringsbegrænsninger.
Sikkerhed
Forbindelser til din kildedatabase er baseret på kontonøgler for dine Azure Cosmos DB-konti. Hvis du roterer eller genopretter nøglerne, skal du opdatere forbindelserne for at sikre, at replikering fungerer. Du kan få flere oplysninger under Forbindelser.
Kontonøgler er ikke direkte synlige for andre Fabric-brugere, når forbindelsen er oprettet. Du kan begrænse, hvem der har adgang til de forbindelser, der er oprettet i Fabric. Skrivninger er ikke tilladt til Azure Cosmos DB-databasen, hverken fra dataoversigten eller analyseslutpunktet i din spejlede database.
Spejling understøtter i øjeblikket ikke godkendelse ved hjælp af skrivebeskyttede kontonøgler, enkeltlogon (SSO) med Microsoft Entra-id'er og rollebaseret adgangskontrol eller administrerede identiteter.
Når dataene er replikeret til Fabric OneLake, skal du sikre adgang til disse data.
Funktioner til databeskyttelse
Detaljeret sikkerhed kan konfigureres i den spejlede database i Microsoft Fabric. Du kan finde flere oplysninger under Detaljerede tilladelser i Microsoft Fabric.
Du kan sikre kolonnefiltre og prædikatbaserede rækkefiltre i tabeller til roller og brugere i Microsoft Fabric:
- Sikkerhed på rækkeniveau i Fabric-datawarehousing
- Sikkerhed på kolonneniveau i Fabric-datawarehousing
Du kan også maskere følsomme data fra brugere, der ikke er administratorer, ved hjælp af dynamisk datamaskering:
Netværkssikkerhed
Spejling understøtter i øjeblikket ikke private slutpunkter eller kundeadministrerede nøgler (CMK) på OneLake. Spejling understøttes ikke for Azure Cosmos DB-konti med netværkssikkerhedskonfigurationer, der er mindre tilladte end alle netværk, ved hjælp af tjenesteslutpunkter, ved hjælp af private slutpunkter, ved hjælp af IP-adresser eller ved hjælp af andre indstillinger, der kan begrænse adgangen til kontoen på det offentlige netværk. Azure Cosmos DB-konti skal være åbne for alle netværk for at arbejde med spejling.
Ventetid for it-katastrofeberedskab og replikering
I Fabric kan du udrulle indhold til datacentre i andre områder end det lokale område for Fabric-lejeren. Du kan få flere oplysninger under Understøttelse af flere geografiske områder.
For en Azure Cosmos DB-konto med et primært skriveområde og flere læseområder vælger spejling det læseområde i Azure Cosmos DB, der er tættest på det område, hvor Fabric-kapaciteten er konfigureret. Dette valg hjælper med at levere replikering med lav ventetid til spejling.
Når du skifter din Azure Cosmos DB-konto til et genoprettelsesområde, vælger spejling automatisk det nærmeste Azure Cosmos DB-område igen.
Bemærk
Spejling understøtter ikke konti med flere skriveområder.
Dine Cosmos DB-data, der er replikeret til OneLake, skal konfigureres til at håndtere afbrydelser for hele området. Du kan få flere oplysninger under It-katastrofeberedskab i OneLake.
Udforsk dine data med spejling
Du kan få direkte vist og få adgang til spejlede data i OneLake. Du kan også få problemfri adgang til spejlede data uden yderligere dataflytning.
Få mere at vide om, hvordan du får adgang til OneLake ved hjælp af ADLS Gen2 API'er eller SDK, OneLake File Explorer og Azure Storage Explorer.
Du kan oprette forbindelse til SQL Analytics-slutpunktet fra værktøjer som SQL Server Management Studio (SSMS) eller ved hjælp af drivere som Microsoft Open Database Connectivity (ODBC) og JDBC (Java Database Connectivity). Du kan finde flere oplysninger under Forbindelse til SQL Analytics-slutpunkter.
Du kan også få adgang til spejlede data med tjenester som:
- Azure-tjenester som Azure Databricks, Azure HDInsight eller Azure Synapse Analytics
- Fabric Lakehouse ved hjælp af genveje til datakonstruktion og datavidenskabsscenarier
- Andre spejlede databaser eller lagre i Fabric-arbejdsområdet
Du kan også bygge løsninger til medaljonsarkitektur, rense og transformere de data, der lander i en spejlet database, som bronzelaget. Du kan få flere oplysninger under Understøttelse af medaljonsarkitektur i Fabric.
Prisfastsættelse
Spejling er gratis for beregning, der bruges til at replikere dine Cosmos DB-data til Fabric OneLake. Lager i OneLake er gratis baseret på visse betingelser. Du kan finde flere oplysninger under OneLake-priser for spejling. Beregningsforbruget for forespørgsler om data via SQL, Power BI eller Spark opkræves stadig på baggrund af Fabric Capacity.
Hvis du bruger dataoversigten i Fabric-spejling, påløber du typiske omkostninger baseret på brug af anmodningsenhed (RU) for at udforske objektbeholderne og forespørge elementerne i azure Cosmos DB-kildens database. Funktionen til løbende sikkerhedskopiering af Azure Cosmos DB er en forudsætning for spejling: Der gælder standardgebyrer for løbende sikkerhedskopiering. Der er ingen ekstra gebyrer for spejling ved løbende sikkerhedskopiering af fakturering. Du kan finde flere oplysninger under Priser på Azure Cosmos DB.