Analyses en Business Intelligence (BI) op uw Azure Cosmos DB-gegevens
Azure Cosmos DB biedt verschillende opties om grootschalige analyses en BI-rapportage over uw operationele gegevens mogelijk te maken.
Voor zinvolle inzichten in uw Azure Cosmos DB-gegevens moet u mogelijk query's uitvoeren op meerdere partities, verzamelingen of databases. In sommige gevallen kunt u deze gegevens combineren met andere gegevensbronnen in uw organisatie, zoals Azure SQL Database, Azure Data Lake Storage Gen2, enzovoort. U kunt ook query's uitvoeren met statistische functies, zoals som, aantal, enzovoort. Dergelijke query's hebben veel rekenkracht nodig, die waarschijnlijk meer aanvraageenheden (RU's) verbruikt. Als gevolg hiervan kunnen deze query's mogelijk van invloed zijn op de bedrijfskritieke workloadprestaties.
Als u transactionele workloads wilt isoleren van de invloed op de prestaties van complexe analytische query's, worden databasegegevens 's nachts opgenomen naar een centrale locatie met behulp van complexe ETL-pijplijnen (Extract-Transform-Load). Dergelijke ETL-analyses zijn complex, kostbaar met vertraagde inzichten over bedrijfsgegevens.
In Azure Cosmos DB worden deze uitdagingen aangepakt door nul ETL- en kosteneffectieve analyseaanbiedingen te bieden.
Zero ETL, bijna realtime analyses in Azure Cosmos DB
Azure Cosmos DB biedt nul ETL, bijna realtime analyses van uw gegevens, zonder dat dit van invloed is op de prestaties van uw transactionele workloads of aanvraageenheden (RU's). Deze aanbiedingen verwijderen de behoefte aan complexe ETL-pijplijnen, waardoor uw Azure Cosmos DB-gegevens naadloos beschikbaar zijn voor analyse-engines. Met een verminderde latentie voor inzichten kunt u een verbeterde klantervaring bieden en sneller reageren op wijzigingen in de marktomstandigheden of bedrijfsomgeving. Hier volgen enkele voorbeeldscenario's die u kunt bereiken met snelle inzichten in uw gegevens.
U kunt zero-ETL-analyses en BI-rapportage inSchakelen in Azure Cosmos DB met behulp van de volgende opties:
- Uw gegevens spiegelen in Microsoft Fabric
- Azure Synapse Link inschakelen voor toegang tot gegevens vanuit Azure Synapse Analytics
Optie 1: Uw Azure Cosmos DB-gegevens spiegelen in Microsoft Fabric
Met spiegeling kunt u uw Azure Cosmos DB-databasegegevens naadloos overbrengen naar Microsoft Fabric. Met nul ETL krijgt u snelle, uitgebreide zakelijke inzichten in uw Azure Cosmos DB-gegevens met behulp van de ingebouwde analysemogelijkheden, BI en AI van Fabric.
Uw operationele Cosmos DB-gegevens worden stapsgewijs gerepliceerd naar Fabric OneLake in bijna realtime. Gegevens in OneLake worden opgeslagen in opensource Delta Parquet-indeling en beschikbaar gemaakt voor alle analytische engines in Fabric. Met open toegang kunt u deze gebruiken met verschillende Azure-services, zoals Azure Databricks, Azure HDInsight en meer. OneLake helpt ook uw gegevensdomein te combineren voor uw analytische behoeften. Gespiegelde gegevens kunnen worden samengevoegd met andere gegevens in OneLake, zoals Lakehouses, Warehouses of snelkoppelingen. U kunt ook Azure Cosmos DB-gegevens samenvoegen met andere gespiegelde databasebronnen, zoals Azure SQL Database, Snowflake. U kunt query's uitvoeren in Azure Cosmos DB-verzamelingen of -databases die zijn gespiegeld in OneLake.
Met Mirroring in Fabric hoeft u geen verschillende services van meerdere leveranciers samen te voegen. In plaats daarvan kunt u genieten van een zeer geïntegreerd, end-to-end en gebruiksvriendelijk product dat is ontworpen om uw analysebehoeften te vereenvoudigen. U kunt T-SQL gebruiken om complexe statistische query's en Spark uit te voeren voor gegevensverkenning. U kunt naadloos toegang krijgen tot de gegevens in notebooks, gegevenswetenschap gebruiken om machine learning-modellen te bouwen en Power BI-rapporten te bouwen met Direct Lake, mogelijk gemaakt door uitgebreide Copilot-integratie.
Als u op zoek bent naar analyses van uw operationele gegevens in Azure Cosmos DB, biedt spiegeling het volgende:
- Nul ETL, rendabel in bijna realtime analyses op Azure Cosmos DB-gegevens zonder dat dit van invloed is op uw ru-verbruik (request unit)
- Het gemak van het overbrengen van gegevens over verschillende bronnen naar Fabric OneLake.
- Verbeterde queryprestaties van SQL Engine voor het verwerken van deltatabellen, met V-orderoptimalisaties
- Verbeterde koude begintijd voor Spark-engine met diepe integratie met ML/notebooks
- Integratie met één klik met Power BI met Direct Lake en Copilot
- Uitgebreidere app-integratie voor toegang tot query's en weergaven met GraphQL
- Open toegang tot en van andere services, zoals Azure Databricks
Als u aan de slag wilt gaan met spiegelen, gaat u naar 'Aan de slag met spiegeling'.
Optie 2: Azure Synapse Link voor toegang tot gegevens vanuit Azure Synapse Analytics
Azure Synapse Link voor Azure Cosmos DB zorgt voor een nauwe naadloze integratie tussen Azure Cosmos DB en Azure Synapse Analytics, waardoor nul ETL mogelijk is, bijna realtime analyses voor uw operationele gegevens. Transactionele gegevens worden naadloos gesynchroniseerd met analytische opslag, waarin de gegevens in kolomindeling worden opgeslagen die zijn geoptimaliseerd voor analyse.
Azure Synapse Analytics heeft toegang tot deze gegevens in analytische opslag, zonder verdere verplaatsing, met behulp van Azure Synapse Link. Bedrijfsanalisten, gegevenstechnici en gegevenswetenschappers kunnen nu Synapse Spark of Synapse SQL gebruiken om bijna realtime business intelligence, analyses en machine learning-pijplijnen uit te voeren.
In de volgende afbeelding ziet u de integratie van Azure Synapse Link met Azure Cosmos DB en Azure Synapse Analytics:
Belangrijk
Spiegeling in Microsoft Fabric is nu beschikbaar in preview voor NoSql-API. Deze functie biedt alle mogelijkheden van Azure Synapse Link met betere analytische prestaties, de mogelijkheid om uw gegevensdomein te combineren met Fabric OneLake en toegang tot uw gegevens in OneLake te openen met de Delta Parquet-indeling. Als u Azure Synapse Link overweegt, raden we u aan om spiegeling uit te voeren om de algehele geschiktheid voor uw organisatie te beoordelen. Klik hier om aan de slag te gaan met spiegelen.
Ga naar 'Aan de slag met Azure Synapse Link' om aan de slag te gaan met Azure Synapse Link.
Realtime analyses en BI in Azure Cosmos DB: andere opties
Er zijn enkele andere opties om realtime analyses in te schakelen voor Azure Cosmos DB-gegevens:
- Wijzigingenfeed gebruiken
- Spark-connector rechtstreeks gebruiken in Azure Cosmos DB
- Power BI-connector rechtstreeks gebruiken in Azure Cosmos DB
Hoewel deze opties zijn opgenomen voor volledigheid en goed werken met query's met één partitie in realtime, hebben deze methoden de volgende uitdagingen voor analytische query's:
Invloed op de prestaties van uw workload:
Analytische query's zijn meestal complex en verbruiken aanzienlijke rekencapaciteit. Wanneer deze query's rechtstreeks op uw Azure Cosmos DB-gegevens worden uitgevoerd, kan het zijn dat de prestaties van uw transactionele query's afnemen.
Gevolgen voor kosten:
Wanneer analytische query's rechtstreeks op uw database of verzamelingen worden uitgevoerd, vergroten ze de behoefte aan toegewezen aanvraageenheden, omdat analytische query's doorgaans complex zijn en meer rekenkracht nodig hebben. Verhoogd RU-gebruik leidt waarschijnlijk tot aanzienlijke kosten in de loop van de tijd, als u statistische query's uitvoert.
In plaats van deze opties raden we u aan spiegeling te gebruiken in Microsoft Fabric of Azure Synapse Link, die nul ETL-analyses bieden, zonder dat dit van invloed is op de prestaties van transactionele werkbelastingen of aanvraageenheden.