Interoperabilita formátů tabulek Delta Lake
V Microsoft Fabric je formát tabulky Delta Lake standardem pro analýzy. Delta Lake je opensourcová vrstva úložiště, která přináší transakce ACID (Atomicity, Consistency, Isolation, Durability) do úloh pro velké objemy dat a analýzy.
Všechny prostředí Fabric generují a využívají tabulky Delta Lake, což zajišťuje interoperabilitu a jednotné uživatelské prostředí produktů. Tabulky Delta Lake vytvořené jedním výpočetním strojem, jako je Datový sklad Fabric nebo Synapse Spark, může využívat jakýkoli jiný stroj, jako je Power BI. Při příjmu dat do Fabric je ukládá ve výchozím nastavení jako tabulky Delta. Externí data obsahující tabulky Delta Lake můžete snadno integrovat pomocí klávesových zkratek OneLake.
Funkce Delta Lake a zkušenosti Fabric
Aby bylo dosaženo interoperability, všechna prostředí Fabric jsou v souladu s funkcemi Delta Lake a možnostmi Fabric. Některá prostředí mohou zapisovat pouze do tabulek Delta Lake, zatímco jiná z nich mohou číst.
- Zapisovatelé: Datové sklady, událostní toky a exportované sémantické modely Power BI do OneLake
- čtenáři: Koncový bod analýzy SQL a sémantické modely Power BI Direct Lake
- Autoři a čtenáři: běhové prostředí Fabric Spark, toky dat, datové kanály a databáze Kusto Query Language (KQL)
Následující matice ukazuje klíčové funkce Delta Lake a jejich podporu pro jednotlivé funkce Fabric.
Síťové možnosti | Mapování sloupců založených na názvu | Vektory odstranění | Psaní ve formátu V-order | Optimalizace a údržba tabulek | Zápis diskových oddílů | Čtení oddílů | Klasifikace kapalin | TIMESTAMP_NTZ | Verze delta reader/writer a výchozí funkce tabulek |
---|---|---|---|---|---|---|---|---|---|
Export datového skladu Delta Lake | Ne | Ano | Ano | Ano | Ne | Ano | Ne | Ne | Čtenář: 3 Autor: 7 Vektory odstranění |
Koncový bod analýzy SQL | Ano | Ano | Neplatí | Nevztahuje se | Není k dispozici (není k dispozici) | Ano | Ano | Ne | Nepoužitelné (není použitelné) |
Fabric Spark Runtime 1.3 | Ano | Ano | Ano | Ano | Ano | Ano | Ano | Ano | Čtenář: 1 Autor: 2 |
Prostředí Fabric Spark Runtime 1.2 | Ano | Ano | Ano | Ano | Ano | Ano | Ano, jen pro čtení | Ano | Čtenář: 1 Autor: 2 |
Fabric Spark Runtime 1.1 | Ano | Ne | Ano | Ano | Ano | Ano | Ano, pouze ke čtení | Ne | Čtenář: 1 Spisovatel: 2 |
Datové toky | Ano | Ano | Ano | Ne | Ano | Ano | Ano, jen pro čtení | Ne | Čtenář: 1 Spisovatel: 2 |
Datové kanály | Ne | Ne | Ano | Ne | Ano, přepsat pouze | Ano | Ano, jen pro čtení | Ne | Čtenář: 1 Spisovatel: 2 |
Sémantické modely Power BI Direct Lake | Ano | Ano | N/A (není použitelné) | Nelze použít | Není k dispozici (není k dispozici) | Ano | Ano | Ne | Nepoužitelné (nevztahuje se) |
Export sémantických modelů Power BI do OneLake | Ano | Nepoužitelné (neaplikovatelné) | Ano | Ne | Ano | Nevztahuje se | Ne | Ne | Čtenář: 2 Spisovatel: 5 |
Databáze KQL | Ano | Ano | Ne | Žádné* | Ano | Ano | Ne | Ne | Čtenář: 1 Zapisovač: 1 |
Eventstreams | Ne | Ne | Ne | Ne | Ano | Nevztahuje se (nevztahuje se) | Ne | Ne | Čtenář: 1 Spisovatel: 2 |
* databáze KQL poskytují určité možnosti údržby tabulek, jako je uchovávání. Data se odeberou na konci doby uchovávání z OneLake. Další informace naleznete v tématu Jedna logická kopie.
Poznámka
- Systém Fabric ve výchozím nastavení nezapisuje mapování pojmenovaných sloupců. Výchozí prostředí Fabric generuje tabulky, které jsou kompatibilní napříč službou. Delta Lake, vytvořené službami třetích stran, může mít nekompatibilní funkce tabulek.
- Některé funkce platformy Fabric nemají zděděné možnosti optimalizace a údržby tabulek, jako jsou komprese datových bloků, řazení ve formátu V a vyčištění starých neodkazovaných souborů. Pokud chcete tabulky Delta Lake udržovat optimální pro analýzy, postupujte podle technik v Použití funkce údržby tabulek ke správě rozdílových tabulek v prostředí Fabric pro tabulky ingestované pomocí těchto zkušeností.
Aktuální omezení
Fabric v současné době nepodporuje tyto funkce Delta Lake:
- Delta Lake 3.x Uniform
- Zápis identitních sloupců (proprietární funkce Databricks)
- Delta Live Tables (proprietární funkce Databricks)
- RLE (kódování délek běhů) je povoleno v souboru kontrolního bodu
Související obsah
- Co je Delta Lake?
- Přečtěte si další informace o tabulkách Delta Lake v Fabric Lakehouse a Synapse Sparku.
- Informace o Direct Lake v Power BI a Microsoft Fabric.
- Přečtěte si další informace o dotazování tabulek ze skladu prostřednictvím publikovaných protokolů Delta Lake.