Del via


Speiling av Azure Cosmos DB (forhåndsversjon)

Speiling i Microsoft Fabric gir en sømløs no-ETL-opplevelse for å integrere eksisterende Azure Cosmos DB-data med resten av dataene dine i Microsoft Fabric. Azure Cosmos DB-dataene replikeres kontinuerlig direkte til Fabric OneLake i nær sanntid, uten noen ytelsespåvirkning på transaksjonsarbeidsbelastningene eller forbruker forespørselsenheter (RUer).

Data i OneLake lagres i deltaformatet med åpen kildekode og gjøres automatisk tilgjengelig for alle analytiske motorer på Fabric.

Du kan bruke innebygde Power BI-funksjoner til å få tilgang til data i OneLake i DirectLake-modus. Med Copilot forbedringer i Fabric kan du bruke kraften i generativ KUNSTIG til å få viktig innsikt i forretningsdataene dine. I tillegg til Power BI kan du bruke T-SQL til å kjøre komplekse aggregerte spørringer eller bruke Spark for datautforskning. Du kan sømløst få tilgang til dataene i notatblokker og bruke datavitenskap til å bygge maskinlæringsmodeller.

Viktig

Speiling for Azure Cosmos DB er for øyeblikket i forhåndsversjon. Produksjonsarbeidsbelastninger støttes ikke under forhåndsvisning. For øyeblikket støttes bare Azure Cosmos DB for NoSQL-kontoer.

Hvorfor bruke speiling i Stoff?

Med Mirroring in Fabric trenger du ikke å sette sammen forskjellige tjenester fra flere leverandører. I stedet kan du nyte et svært integrert, ende-til-ende og brukervennlig produkt som er utformet for å forenkle analysebehovene og bygges for åpenhet.

Hvis du leter etter BI-rapportering eller analyse på driftsdataene dine i Azure Cosmos DB, gir speiling:

  • No-ETL, kostnadseffektiv nær sanntidstilgang til Azure Cosmos DB-data uten å påvirke enhetsforbruket på forespørsel
  • Enkel å bringe data over ulike kilder til Fabric OneLake
  • Delta-tabelloptimaliseringer med v-rekkefølge for lynraske lesinger
  • Integrering med ett klikk med Power BI med Direct Lake og Copilot
  • Rik forretningsinnsikt ved å bli med i data på tvers av ulike kilder
  • Rikere appintegrering for å få tilgang til spørringer og visninger

OneLake-data lagres i Delta Lake-formatet med åpen kildekode, slik at du kan bruke dem med ulike løsninger i og utenfor Microsoft. Dette dataformatet gjør det enklere å bygge en enkelt dataeiendom for dine analytiske behov.

Hvilke analyseopplevelser er innebygd?

Speilede databaser er et element i Fabric Data Warehousing som er forskjellig fra endepunktet for lager- og SQL-analyse.

Diagram over Fabric Mirroring for Azure Cosmos DB.

Hver Mirrored Azure Cosmos DB-database har tre elementer du kan samhandle med i Fabric-arbeidsområdet:

  • Det speilede databaseelementet. Speiling administrerer replikering av data til OneLake og konvertering til Parquet, i et analyseklart format. Dette muliggjør nedstrømsscenarioer som datateknikk, datavitenskap og mer.
  • SQL Analytics-endepunkt, som genereres automatisk
  • Standard semantisk modell, som genereres automatisk

Speilet database

Den speilede databasen viser replikeringsstatusen og kontrollene for å stoppe eller starte replikering i Fabric OneLake. Du kan også vise kildedatabasen i skrivebeskyttet modus ved hjelp av Azure Cosmos DB-datautforskeren. Ved hjelp av datautforskeren kan du vise beholderne i azure Cosmos DB-databasen og spørre etter dem. Disse operasjonene bruker forespørselsenheter (RUer) fra Azure Cosmos DB-kontoen din. Eventuelle endringer i kildedatabasen gjenspeiles umiddelbart i Fabrics kildedatabasevisning. Skriving til kildedatabasen er ikke tillatt fra Fabric, da du bare kan vise dataene.

Endepunkt for SQL-analyse

Hver speilede database har et autogenerert SQL Analytics-endepunkt som gir en rik analytisk opplevelse på toppen av OneLakes Delta-tabeller som er opprettet av speilingsprosessen. Du har tilgang til kjente T-SQL-kommandoer som kan definere og spørre etter dataobjekter, men ikke manipulere dataene fra endepunktet for SQL-analyse, siden det er en skrivebeskyttet kopi.

Du kan utføre følgende handlinger i SQL Analytics-endepunktet:

  • Utforsk Delta Lake-tabeller ved hjelp av T-SQL. Hver tabell er tilordnet til en beholder fra Azure Cosmos DB-databasen.
  • Opprett spørringer og visninger uten kode, og utforsk dem visuelt uten å skrive en kodelinje.
  • Bli med i og spør etter data i andre speilvendte databaser, lagre og lakehouses i samme arbeidsområde.
  • Du kan enkelt visualisere og bygge BI-rapporter basert på SQL-spørringer eller -visninger.

I tillegg til redigeringsprogrammet for SQL-spørringer finnes det et bredt økosystem av verktøy. Disse verktøyene inkluderer mssql-utvidelsen med Visual Studio Code, SQL Server Management Studio (SSMS) og til og med GitHub Copilot. Du kan supercharge analyse og innsikt generasjon fra verktøyet du ønsker.

Semantisk modell

Standard semantisk modell er en automatisk klargjort Power BI Semantic-modell. Denne funksjonen gjør at forretningsmetrikk kan opprettes, deles og brukes på nytt. Hvis du vil ha mer informasjon, kan du se semantiske modeller.

Hvordan fungerer nesten replikering i sanntid?

Når du aktiverer speiling på Azure Cosmos DB-databasen, replikeres innsettinger, oppdaterer og sletter operasjoner på OLTP-data (Online Transaction Processing) kontinuerlig til Fabric OneLake for analyseforbruk.

Funksjonen for kontinuerlig sikkerhetskopiering er en forutsetning for speiling. Du kan aktivere enten 7-dagers eller 30-dagers kontinuerlig sikkerhetskopiering på Azure Cosmos DB-kontoen. Hvis du aktiverer kontinuerlig sikkerhetskopiering spesielt for speiling, anbefales 7-dagers kontinuerlig sikkerhetskopiering, da det er kostnadsfritt.

Merk

Speiling bruker ikke Azure Cosmos DBs analytiske lager eller endrer feed som en endringsdatainnhentingskilde. Du kan fortsette å bruke disse funksjonene uavhengig av hverandre, sammen med speiling.

Det kan ta noen minutter å replikere Azure Cosmos DB-data til Fabric OneLake. Avhengig av dataenes første øyeblikksbilde eller hyppigheten av oppdateringer/slettinger, kan replikering også ta lengre tid i enkelte tilfeller. Replikering påvirker ikke forespørselsenhetene (RU-er) du har tildelt for transaksjonsarbeidsbelastningene.

Hva du kan forvente av speiling

Det finnes noen hensyn og støttede scenarioer du bør vurdere før speiling.

Installasjonshensyn

Hvis du vil speile en database, bør den allerede klargjøres i Azure. Du må aktivere kontinuerlig sikkerhetskopiering på kontoen som en forutsetning.

  • Du kan bare speile hver database enkeltvis om gangen. Du kan velge hvilken database du vil speile.
  • Du kan speile den samme databasen flere ganger i samme arbeidsområde. Som en anbefalt fremgangsmåte kan en enkelt kopi av databasen brukes på nytt på tvers av innsjøer, lagre eller andre speilvendte databaser. Du trenger ikke å sette opp flere speil i samme database.
  • Du kan også speile den samme databasen på tvers av ulike Fabric-arbeidsområder eller -leiere.
  • Endringer i Azure Cosmos DB-beholdere, for eksempel å legge til nye beholdere og slette eksisterende, replikeres sømløst til Fabric. Du kan begynne å speile en tom database uten beholdere, for eksempel, og speiling plukker sømløst opp beholderne som er lagt til på et senere tidspunkt.

Støtte for nestede data

Nestede data vises som en JSON-streng i SQL Analytics-endepunkttabeller. Du kan bruke OPENJSON, CROSS APPLYog OUTER APPLY i T-SQL-spørringer eller -visninger til å utvide disse dataene selektivt. Hvis du bruker Power Query, kan du også bruke ToJson funksjonen til å utvide disse dataene.

Merk

Stoffet har en begrensning for strengkolonner på 8 kB i størrelse. Hvis du vil ha mer informasjon, kan du se begrensninger for datalager.

Behandle skjemaendringer

Speiling replikerer automatisk egenskaper på tvers av Azure Cosmos DB-elementer, med skjemaendringer. Eventuelle nye egenskaper som oppdages i et element, vises som nye kolonner, og de manglende egenskapene representeres som null i Fabric.

Hvis du gir nytt navn til en egenskap i et element, beholder Fabric-tabeller både de gamle og nye kolonnene. Den gamle kolonnen viser null, og den nye viser den nyeste verdien, for alle elementer som replikeres etter operasjonen med nytt navn.

Hvis du endrer datatypen for en egenskap i Azure Cosmos DB-elementer, støttes endringene for kompatible datatyper som kan konverteres. Hvis datatypene ikke er kompatible for konvertering i Delta, representeres de som nullverdier.

Sql Analytics-endepunkttabeller konverterer Delta-datatyper til T-SQL-datatyper.

Dupliserte kolonnenavn

Azure Cosmos DB støtter kolonnenavn som skiller mellom store og små bokstaver, basert på JSON-standarden. Speiling støtter disse dupliserte kolonnenavnene ved å legge _n til kolonnenavnet, der n det vil være en numerisk verdi.

Hvis for eksempel Azure Cosmos DB-elementet har addressName og AddressName som unike egenskaper, har Fabric-tabeller tilsvarende addressName og AddressName_1 kolonner. Hvis du vil ha mer informasjon, kan du se replikeringsbegrensninger.

Sikkerhet

Tilkoblinger til kildedatabasen er basert på kontonøkler for Azure Cosmos DB-kontoene dine. Hvis du roterer eller genererer nøklene på nytt, må du oppdatere tilkoblingene for å sikre at replikering fungerer. Hvis du vil ha mer informasjon, kan du se tilkoblinger.

Kontonøkler er ikke direkte synlige for andre Fabric-brukere når tilkoblingen er konfigurert. Du kan begrense hvem som har tilgang til tilkoblingene som er opprettet i Fabric. Det er ikke tillatt å skrive til Azure Cosmos DB-database fra datautforskeren eller analyseendepunktet i den speilede databasen.

Speiling støtter for øyeblikket ikke godkjenning ved hjelp av skrivebeskyttede kontonøkler, enkel pålogging (SSO) med Microsoft Entra-ID-er og rollebasert tilgangskontroll eller administrerte identiteter.

Når dataene er replikert til Fabric OneLake, må du sikre tilgang til disse dataene.

Databeskyttelsesfunksjoner

Granulær sikkerhet kan konfigureres i den speilvendte databasen i Microsoft Fabric. Hvis du vil ha mer informasjon, kan du se detaljerte tillatelser i Microsoft Fabric.

Du kan sikre kolonnefiltre og predikatbaserte radfiltre på tabeller til roller og brukere i Microsoft Fabric:

Du kan også maskere sensitive data fra ikke-administratorbrukere ved hjelp av dynamisk datamaskering:

Nettverkssikkerhet

Speiling støtter for øyeblikket ikke private endepunkter eller kundeadministrerte nøkler (CMK) på OneLake. Speiling støttes ikke for Azure Cosmos DB-kontoer med nettverkssikkerhetskonfigurasjoner som er mindre tillatte enn alle nettverk, bruk av tjenesteendepunkter, bruk av private endepunkter, bruk av IP-adresser eller andre innstillinger som kan begrense offentlig nettverkstilgang til kontoen. Azure Cosmos DB-kontoer bør være åpne for alle nettverk for å arbeide med speiling.

Ventetid for nødoppretting og replikering

I Fabric kan du distribuere innhold til datasentre i andre områder enn hjemmeområdet til Fabric-leieren. Hvis du vil ha mer informasjon, kan du se multi-geo-støtte.

For en Azure Cosmos DB-konto med et primært skriveområde og flere leseområder velger speiling leseområdet Azure Cosmos DB nærmest området der Fabric-kapasiteten er konfigurert. Dette utvalget bidrar til å gi lav ventetidsreplikering for speiling.

Når du bytter Azure Cosmos DB-kontoen til et gjenopprettingsområde, velger speiling automatisk det nærmeste Azure Cosmos DB-området på nytt.

Merk

Speiling støtter ikke kontoer med flere skriveområder.

Cosmos DB-dataene replikert til OneLake må konfigureres til å håndtere områdeavbrudd. Hvis du vil ha mer informasjon, kan du se nødgjenoppretting i OneLake.

Utforsk dataene dine med speiling

Du kan vise og få direkte tilgang til speilvendte data i OneLake. Du kan også sømløst få tilgang til speilvendte data uten ytterligere dataflytting.

Mer informasjon om hvordan du får tilgang til OneLake ved hjelp av ADLS Gen2 API-er eller SDK, OneLake File Explorer og Azure Storage Explorer.

Du kan koble til SQL Analytics-endepunktet fra verktøy som SQL Server Management Studio (SSMS) eller bruke drivere som Microsoft Open Database Connectivity (ODBC) og Java Database Connectivity (JDBC). Hvis du vil ha mer informasjon, kan du se TILKOBLING FOR SQL Analytics-endepunkt.

Du kan også få tilgang til speilvendte data med tjenester som:

  • Azure-tjenester som Azure Databricks, Azure HDInsight eller Azure Synapse Analytics
  • Fabric Lakehouse bruker snarveier for scenarioer for datateknikk og datavitenskap
  • Andre speilvendte databaser eller lagre i Fabric-arbeidsområdet

Du kan også bygge arkitekturløsninger for medaljong, rengjøre og transformere dataene som lander i speilvendt database som bronselaget. Hvis du vil ha mer informasjon, kan du se støtte for medaljongarkitektur i Fabric.

Prissetting

Speiling er gratis for databehandling som brukes til å replikere Cosmos DB-data til Fabric OneLake. Lagring i OneLake er kostnadsfritt basert på visse betingelser. Hvis du vil ha mer informasjon, kan du se OneLake-priser for speiling. Databehandlingsbruken for spørring av data via SQL, Power BI eller Spark belastes fortsatt basert på stoffkapasiteten.

Hvis du bruker datautforskeren i Stoffspeiling, påløper du typiske kostnader basert på forespørselsenhetsbruk (RU) for å utforske beholderne og spørre etter elementene i kildedatabasen Azure Cosmos DB. Azure Cosmos DB-funksjonen for kontinuerlig sikkerhetskopiering er en forutsetning for speiling: Standardkostnader for kontinuerlig sikkerhetskopiering gjelder. Det er ingen ekstra kostnader for speiling på kontinuerlig fakturering av sikkerhetskopiering. Hvis du vil ha mer informasjon, kan du se Azure Cosmos DB-priser.

Neste trinn