Sdílet prostřednictvím


Analýzy a business intelligence (BI) na datech služby Azure Cosmos DB

Azure Cosmos DB nabízí různé možnosti, jak povolit rozsáhlé analýzy a vytváření sestav BI pro vaše provozní data.

Pokud chcete získat smysluplné přehledy o datech služby Azure Cosmos DB, budete se možná muset dotazovat napříč několika oddíly, kolekcemi nebo databázemi. V některých případech můžete tato data kombinovat s jinými zdroji dat ve vaší organizaci, jako je Azure SQL Database, Azure Data Lake Storage Gen2 atd. Můžete se také dotazovat s agregačními funkcemi, jako je součet, počet atd. Tyto dotazy potřebují velký výpočetní výkon, který pravděpodobně spotřebovává více jednotek žádostí (RU) a v důsledku toho můžou tyto dotazy potenciálně ovlivnit výkon klíčových úloh.

Pokud chcete izolovat transakční úlohy před dopadem na výkon složitých analytických dotazů, data databáze se ingestují každou noc do centrálního umístění pomocí složitých kanálů ETL (Extract-Transform-Load). Takové analýzy založené na ETL jsou složité a nákladné s zpožděnými přehledy o obchodních datech.

Azure Cosmos DB řeší tyto problémy tím, že poskytuje nulové nabídky analýz ETL a nákladově efektivních analytických možností.

Nula ETL, téměř v reálném čase analytics ve službě Azure Cosmos DB

Azure Cosmos DB nabízí nulovou analýzu ETL téměř v reálném čase na vašich datech, aniž by to ovlivnilo výkon transakčních úloh nebo jednotek žádostí. Tyto nabídky odstraňují potřebu složitých kanálů ETL, aby byla data Azure Cosmos DB bezproblémově dostupná analytickým modulům. Díky nižší latenci přehledům můžete poskytovat vylepšené prostředí pro zákazníky a rychleji reagovat na změny v podmínkách trhu nebo v obchodním prostředí. Tady je několik ukázkových scénářů, které můžete dosáhnout pomocí rychlých přehledů o vašich datech.

V Azure Cosmos DB můžete povolit analýzy a generování sestav ETL s nulovým využitím ETL a generování sestav BI pomocí následujících možností:

  • Zrcadlení dat do Microsoft Fabric
  • Povolení azure Synapse Linku pro přístup k datům z Azure Synapse Analytics

Možnost 1: Zrcadlení dat Azure Cosmos DB do Microsoft Fabric

Zrcadlení umožňuje bezproblémově přenést data databáze Azure Cosmos DB do Microsoft Fabric. Díky nule ETL můžete získat rychlé a bohaté obchodní přehledy o datech služby Azure Cosmos DB pomocí integrovaných analytických funkcí, BI a AI v prostředcích infrastruktury.

Provozní data cosmos DB se přírůstkově replikují do Fabric OneLake téměř v reálném čase. Data v OneLake jsou uložená v opensourcového formátu Delta Parquet a zpřístupněná všem analytickým modulům v prostředcích Fabric. S otevřeným přístupem ho můžete používat s různými službami Azure, jako jsou Azure Databricks, Azure HDInsight a další. OneLake také pomáhá sjednotit vaše datová aktiva pro vaše analytické potřeby. Zrcadlová data se dají spojit s jinými daty ve OneLake, jako jsou Lakehouses, Warehouses nebo klávesové zkratky. Data služby Azure Cosmos DB můžete také připojit k dalším zrcadleným zdrojům databází, jako je Azure SQL Database, Snowflake. Můžete dotazovat napříč kolekcemi nebo databázemi Azure Cosmos DB zrcadlenými do OneLake.

Díky zrcadlení v prostředcích infrastruktury nemusíte vytvářet různé služby od několika dodavatelů. Místo toho si můžete vychutnat vysoce integrovaný, ucelený a snadno použitelný produkt, který je navržený tak, aby zjednodušil vaše potřeby analýzy. T-SQL můžete použít ke spouštění složitých agregačních dotazů a Sparku pro zkoumání dat. K datům v poznámkových blocích můžete bezproblémově přistupovat, vytvářet modely strojového učení a vytvářet sestavy Power BI pomocí Direct Lake s využitím bohaté integrace Copilotu.

Diagram zrcadlení služby Azure Cosmos DB v Microsoft Fabric

Pokud hledáte analýzu provozních dat ve službě Azure Cosmos DB, zrcadlení poskytuje:

  • Nulová hodnota ETL, nákladově efektivní analýza téměř v reálném čase u dat služby Azure Cosmos DB, aniž by to ovlivnilo spotřebu jednotek žádostí (RU)
  • Snadné přenesení dat mezi různými zdroji do Fabric OneLake
  • Vylepšený výkon dotazů modulu SQL, který zpracovává rozdílové tabulky, s optimalizacemi pořadí V
  • Vylepšený čas studeného startu pro modul Spark s hlubokou integrací s ML/poznámkovými bloky
  • Integrace jedním kliknutím s Power BI s Direct Lake a Copilotem
  • Rozsáhlejší integrace aplikací pro přístup k dotazům a zobrazením pomocí GraphQL
  • Otevření přístupu k jiným službám, jako je Azure Databricks, a z jiných služeb, jako je Azure Databricks

Pokud chcete začít se zrcadlováním, navštivte kurz Začínáme se zrcadlením.

Azure Synapse Link pro Azure Cosmos DB vytváří úzkou bezproblémovou integraci mezi Azure Cosmos DB a Azure Synapse Analytics, která umožňuje nulové ETL a téměř v reálném čase analýzy vašich provozních dat. Transakční data se bezproblémově synchronizují s analytickým úložištěm, které ukládá data ve sloupcovém formátu optimalizovaném pro analýzu.

Azure Synapse Analytics má přístup k datům v analytickém úložišti bez dalšího přesunu pomocí Azure Synapse Linku. Obchodní analytici, datoví inženýři a datoví vědci teď můžou používat Synapse Spark nebo Synapse SQL zaměnitelně ke spouštění kanálů business intelligence, analýz a strojového učení téměř v reálném čase.

Následující obrázek ukazuje integraci Azure Synapse Linku se službou Azure Cosmos DB a Azure Synapse Analytics:

Diagram služby Azure Cosmos DB Synapse Link

Důležité

Zrcadlení v Microsoft Fabric je teď k dispozici ve verzi Preview pro rozhraní API NoSql. Tato funkce poskytuje všechny možnosti Azure Synapse Linku s lepším analytickým výkonem, schopnost sjednotit svá datová aktiva s Fabric OneLake a otevřít přístup k datům ve formátu Delta Parquet. Pokud uvažujete o Azure Synapse Linku, doporučujeme vyzkoušet zrcadlení, abyste posoudili celkové přizpůsobení vaší organizace. Pokud chcete začít se zrcadlováním, klikněte sem.

Pokud chcete začít s Azure Synapse Linkem, přejděte na stránku Začínáme s Azure Synapse Linkem.

Analýzy v reálném čase a BI ve službě Azure Cosmos DB: Další možnosti

Existuje několik dalších možností, jak povolit analýzu dat Azure Cosmos DB v reálném čase:

I když jsou tyto možnosti zahrnuté pro úplnost a dobře fungují s dotazy s jedním oddílem v reálném čase, tyto metody mají pro analytické dotazy následující výzvy:

  • Dopad na výkon vaší úlohy:

    Analytické dotazy jsou obvykle složité a spotřebovávají významnou výpočetní kapacitu. Když se tyto dotazy spouštějí přímo na vašich datech Azure Cosmos DB, může dojít ke snížení výkonu transakčních dotazů.

  • Dopad na náklady:

    Když se analytické dotazy spouštějí přímo s databází nebo kolekcemi, zvyšují potřebu přidělených jednotek žádostí, protože analytické dotazy jsou obvykle složité a vyžadují větší výpočetní výkon. Pokud spustíte agregované dotazy, vyšší využití RU pravděpodobně povede k významnému dopadu na náklady v průběhu času.

Místo těchto možností doporučujeme používat zrcadlení v Microsoft Fabric nebo Azure Synapse Linku, které poskytují nulovou analýzu ETL, aniž by to ovlivnilo výkon transakčních úloh nebo jednotky žádostí.