Sdílet prostřednictvím


Zrcadlení Snowflake v Microsoft Fabric

Zrcadlení v prostředcích infrastruktury poskytuje snadné prostředí, které vám umožní vyhnout se složitým etL (extrakce transformační zátěže) a integrovat stávající data skladu Snowflake se zbývajícími daty v Microsoft Fabric. Stávající data Snowflake můžete průběžně replikovat přímo do OneLake fabric. V prostředcích infrastruktury můžete odemknout výkonné funkce business intelligence, umělou inteligenci, Datoví technici, Datová Věda a scénáře sdílení dat.

Kurz konfigurace databáze Snowflake pro zrcadlení v prostředcích infrastruktury najdete v kurzu : Konfigurace zrcadlených databází Microsoft Fabric ze Snowflake.

Proč používat zrcadlení v prostředcích infrastruktury?

Díky zrcadlení v prostředcích infrastruktury nemusíte vytvářet různé služby od několika dodavatelů. Místo toho si můžete vychutnat vysoce integrovaný, ucelený a snadno použitelný produkt, který je navržený tak, aby zjednodušil vaše potřeby analýzy a vytvořil pro otevřenost a spolupráci mezi Microsoftem, Snowflakem a 1000 technologickými řešeními, která můžou číst opensourcový formát tabulky Delta Lake.

Jaká analytická prostředí jsou integrovaná?

Zrcadlené databáze jsou položka v prostředcích infrastruktury Skladování Dat odlišná od koncového bodu Warehouse a SQL Analytics.

Diagram zrcadlení databáze fabric pro Snowflake

Zrcadlení vytvoří v pracovním prostoru Fabric tři položky:

  • Zrcadlová položka databáze. Zrcadlení spravuje replikaci dat do OneLake a převod na Parquet v analytickém formátu. To umožňuje podřízené scénáře, jako jsou datové inženýrství, datové vědy a další.
  • Koncový bod analýzy SQL
  • Výchozí sémantický model

Každá zrcadlená databáze má automaticky vygenerovaný koncový bod analýzy SQL, který poskytuje bohaté analytické prostředí nad tabulkami Delta vytvořenými procesem zrcadlení. Uživatelé mají přístup ke známým příkazům T-SQL, které mohou definovat a dotazovat datové objekty, ale nebudou manipulovat s daty z koncového bodu analýzy SQL, protože se jedná o kopii určenou jen pro čtení. V koncovém bodu analýzy SQL můžete provést následující akce:

  • Prozkoumejte tabulky, které odkazují na data v tabulkách Delta Lake ze Snowflake.
  • Vytvářejte žádné dotazy na kód a zobrazení a prozkoumejte data vizuálně bez psaní řádku kódu.
  • Vyvíjejte zobrazení SQL, vložené TVFy (funkce s hodnotami tabulky) a uložené procedury pro zapouzdření sémantiky a obchodní logiky v T-SQL.
  • Umožňuje spravovat oprávnění k objektům.
  • Dotazování dat v jiných skladech a v lakehouse ve stejném pracovním prostoru

Kromě editoru dotazů SQL existuje široký ekosystém nástrojů, který může dotazovat koncový bod analýzy SQL, včetně APLIKACE SQL Server Management Studio (SSMS), rozšíření mssql pomocí editoru Visual Studio Code a dokonce i GitHubuCopilot.

Bezpečnostní aspekty

Pokud chcete povolit zrcadlení prostředků infrastruktury, budete potřebovat uživatelská oprávnění pro vaši databázi Snowflake, která obsahuje následující oprávnění:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Další informace najdete v dokumentaci Snowflake k oprávněním řízení přístupu pro tabulky streamování a požadovaná oprávnění pro streamy.

Důležité

Veškeré podrobné zabezpečení vytvořené ve zdrojovém skladu Snowflake musí být znovu nakonfigurováno v zrcadlené databázi v Microsoft Fabric. Další informace najdete v tématu Podrobná oprávnění SQL v Microsoft Fabric.

Aspekty zrcadlených nákladů Snowflake

Fabric neúčtuje poplatky za příchozí přenos dat sítě do OneLake za zrcadlení. Při replikaci dat Snowflake do OneLake nejsou žádné náklady na zrcadlení.

Při zrcadlení dat existují náklady na výpočetní prostředky Snowflake a cloudové dotazy: výpočetní prostředky virtuálního skladu a výpočetní služby cloudových služeb.

  • Poplatky za výpočetní prostředky virtuálního skladu Snowflake:
    • Poplatky za výpočetní prostředky se budou účtovat na straně Snowflake, pokud dojde ke změnám dat, které se čtou ve Snowflake, a následně se zrcadlí do prostředků infrastruktury.
    • Za žádné výpočetní prostředky Snowflake se neúčtují žádné dotazy na metadata spuštěné na pozadí za účelem kontroly změn dat; Dotazy, které generují data, jako SELECT * je například, se probouzí sklad Snowflake a výpočetní prostředky se budou účtovat.
  • Poplatky za výpočetní prostředky služby Snowflake:
    • I když se na pozadí neúčtují žádné poplatky za výpočetní prostředky, jako jsou vytváření, dotazy na metadata, řízení přístupu, zobrazování změn dat a dokonce dotazy DDL, jsou k těmto dotazům spojené náklady na cloud.
    • V závislosti na typu edice Snowflake se vám budou účtovat odpovídající kredity za všechny náklady na cloudové služby.

Na následujícím snímku obrazovky vidíte náklady na výpočetní prostředky virtuálního skladu a cloudové služby pro přidruženou databázi Snowflake, která se zrcadlí do prostředků infrastruktury. V tomto scénáři většina nákladů na výpočetní prostředky cloudových služeb (žlutá) pochází z dotazů na změnu dat na základě výše uvedených bodů. Poplatky za výpočetní prostředky virtuálního skladu (modře) pocházejí výhradně ze změn dat, které se čtou ze Snowflake a zrcadlí se do fabric.

Snímek obrazovky s grafem nákladů Snowflake

Další informace o nákladech na cloudové dotazy specifické pro Snowflake najdete v dokumentaci snowflake: Vysvětlení celkových nákladů.

Další krok