Zrcadlení Snowflake v Microsoft Fabric
Zrcadlení v Microsoft Fabric poskytuje snadnou zkušenost, která vám umožní vyhnout se složitým ETL (extrakce, transformace, nahrávání) a integrovat stávající data vašeho Snowflake skladu s ostatními daty v Microsoft Fabric. Vaše data ze Snowflake můžete nepřetržitě replikovat přímo do OneLake v rámci Fabric. V rámci platformy Fabric můžete odemknout výkonné funkce business intelligence, umělé inteligence, datového inženýrství, datové vědy a scénáře sdílení dat.
Najdete výukový program o konfiguraci databáze Snowflake pro zrcadlení ve Fabricu v Tutorial: Configure Microsoft Fabric mirrored databases from Snowflake.
Proč používat zrcadlení ve Fabric?
Díky funkci Mirroring v systému Fabric nemusíte používat různé služby od několika dodavatelů. Místo toho si můžete vychutnat vysoce integrovaný, ucelený a snadno použitelný produkt, který je navržený tak, aby zjednodušil vaše potřeby analýzy a vytvořil pro otevřenost a spolupráci mezi Microsoftem, Snowflakem a 1000 technologickými řešeními, která můžou číst opensourcový formát tabulky Delta Lake.
Jaká analytická prostředí jsou integrovaná?
Zrcadlené databáze jsou položkou v Fabric Data Warehousing, která je odlišná od Warehouse a SQL analytics endpoint.
Zrcadlení vytvoří v pracovním prostoru Fabric tři položky:
- Zrcadlová položka databáze. Zrcadlení spravuje replikaci dat do OneLake a jeho převod do formátu Parquet ve formátu připraveném pro analýzu. To umožňuje podřízené scénáře, jako jsou datové inženýrství, datové vědy a další.
- Koncový bod analýzy SQL
- Výchozí sémantický model
Každá zrcadlená databáze má automaticky vygenerovaný koncový bod analýzy SQL, který poskytuje bohaté analytické prostředí nad tabulkami Delta vytvořenými procesem zrcadlení. Uživatelé mají přístup ke známým příkazům T-SQL, které mohou definovat a dotazovat datové objekty, ale nebudou manipulovat s daty z koncového bodu analýzy SQL, protože se jedná o kopii určenou jen pro čtení. V koncovém bodu analýzy SQL můžete provést následující akce:
- Prozkoumejte tabulky, které odkazují na data v tabulkách Delta Lake ze Snowflake.
- Umožňuje vytvářet dotazy a zobrazení bez použití kódu a prozkoumávat data vizuálně bez nutnosti napsat jediné řádky kódu.
- Vyvíjejte zobrazení SQL, vložené TVFy (funkce s hodnotami tabulky) a uložené procedury pro zapouzdření sémantiky a obchodní logiky v T-SQL.
- Umožňuje spravovat oprávnění k objektům.
- Dotazování dat v jiných skladech a lakehousech ve stejném pracovním prostoru.
Kromě editoru dotazů SQL existuje široký ekosystém nástrojů, který může dotazovat koncový bod analýzy SQL, včetně SQL Server Management Studio (SSMS), rozšíření mssql pro Visual Studio Code a dokonce i GitHubuCopilot.
Bezpečnostní aspekty
Pokud chcete povolit zrcadlení Fabric, budete potřebovat uživatelská oprávnění ve vaší databázi Snowflake, která obsahuje následující oprávnění:
CREATE STREAM
SELECT table
SHOW tables
DESCRIBE tables
Další informace najdete v dokumentaci Snowflake k oprávněním Řízení přístupu pro streamovací tabulky a požadovaným oprávněním pro streamovací tabulky.
Důležité
Veškeré podrobné zabezpečení vytvořené ve zdrojovém skladu Snowflake musí být znovu nakonfigurováno v zrcadlené databázi v Microsoft Fabric. Další informace najdete v tématu Podrobná oprávnění SQL v Microsoft Fabric.
Ohledy na náklady spojené s provozem Snowflake
Výpočetní prostředky infrastruktury používané k replikaci dat do Fabric OneLake jsou zdarma. Náklady na zrcadlení úložného prostoru jsou bezplatné až do limitu stanoveného podle kapacity. Další informace najdete v tématu Náklady na zrcadlení a Microsoft Fabric ceny. Výpočetní výkon pro dotazování na data pomocí SQL, Power BI nebo Spark se účtuje podle pravidelných sazeb.
Fabric neúčtuje poplatky za přenos dat do OneLake pro zrcadlení.
Při zrcadlení dat existují náklady na výpočetní prostředky Snowflake a náklady na cloudové dotazy: výpočetní prostředky virtuálního skladu a výpočetní náklady na cloudové služby.
- Poplatky za výpočetní prostředky virtuálního skladu Snowflake:
- Poplatky za výpočetní prostředky se budou účtovat na straně Snowflake, pokud dojde ke změnám dat, které se čtou ve Snowflake, a následně se zrcadlí do Fabric.
- Za žádné výpočetní prostředky Snowflake se neúčtují dotazy na metadata, které běží na pozadí a zjišťují změny v datech. Dotazy, které generují data, například
SELECT *
, probudí sklad Snowflake a výpočetní prostředky budou účtovány.
- Poplatky za výpočetní služby Snowflake
- I když se na pozadí neúčtují žádné poplatky za výpočetní prostředky, jako jsou vytváření, dotazy na metadata, řízení přístupu, zobrazování změn dat a dokonce dotazy DDL, jsou k těmto dotazům spojené náklady na cloud.
- V závislosti na typu edice Snowflake se vám budou účtovat odpovídající kredity za všechny náklady na cloudové služby.
Na následujícím snímku obrazovky můžete vidět náklady na výpočetní prostředky virtuálního skladu a náklady na výpočetní prostředky cloudových služeb pro přidruženou databázi Snowflake, která se zrcadlí do Fabric. V tomto scénáři většina nákladů na výpočetní prostředky cloudových služeb (žlutá) pochází z dotazů na změnu dat na základě výše uvedených bodů. Poplatky za výpočetní prostředky virtuálního skladu (modře) pocházejí výhradně z toho, že změny dat jsou čteny ze Snowflake a zrcadlí se do Fabric.
Další informace o nákladech na cloudové dotazy specifické pro Snowflake najdete v dokumentaci snowflake: Vysvětlení celkových nákladů.