Sdílet prostřednictvím


Interoperabilita formátů tabulek Delta Lake

V Microsoft Fabric je formát tabulky Delta Lake standardem pro analýzy. Delta Lake je opensourcová vrstva úložiště, která přináší transakce ACID (Atomicity, Consistency, Isolation, Durability) do úloh pro velké objemy dat a analýzy.

Všechny prostředí Fabric generují a využívají tabulky Delta Lake, což zajišťuje interoperabilitu a jednotné uživatelské prostředí produktů. Tabulky Delta Lake vytvořené jedním výpočetním strojem, jako je Datový sklad Fabric nebo Synapse Spark, může využívat jakýkoli jiný stroj, jako je Power BI. Při příjmu dat do Fabric je ukládá ve výchozím nastavení jako tabulky Delta. Externí data obsahující tabulky Delta Lake můžete snadno integrovat pomocí klávesových zkratek OneLake.

Funkce Delta Lake a zkušenosti Fabric

Aby bylo dosaženo interoperability, všechna prostředí Fabric jsou v souladu s funkcemi Delta Lake a možnostmi Fabric. Některá prostředí mohou zapisovat pouze do tabulek Delta Lake, zatímco jiná z nich mohou číst.

  • Zapisovatelé: Datové sklady, událostní toky a exportované sémantické modely Power BI do OneLake
  • čtenáři: Koncový bod analýzy SQL a sémantické modely Power BI Direct Lake
  • Autoři a čtenáři: běhové prostředí Fabric Spark, toky dat, datové kanály a databáze Kusto Query Language (KQL)

Následující matice ukazuje klíčové funkce Delta Lake a jejich podporu pro jednotlivé funkce Fabric.

Síťové možnosti Mapování sloupců založených na názvu Vektory odstranění Psaní ve formátu V-order Optimalizace a údržba tabulek Zápis diskových oddílů Čtení oddílů Klasifikace kapalin TIMESTAMP_NTZ Verze delta reader/writer a výchozí funkce tabulek
Export datového skladu Delta Lake Ne Ano Ano Ano Ne Ano Ne Ne Čtenář: 3
Autor: 7
Vektory odstranění
Koncový bod analýzy SQL Ano Ano Neplatí Nevztahuje se Není k dispozici (není k dispozici) Ano Ano Ne Nepoužitelné (není použitelné)
Fabric Spark Runtime 1.3 Ano Ano Ano Ano Ano Ano Ano Ano Čtenář: 1
Autor: 2
Prostředí Fabric Spark Runtime 1.2 Ano Ano Ano Ano Ano Ano Ano, jen pro čtení Ano Čtenář: 1
Autor: 2
Fabric Spark Runtime 1.1 Ano Ne Ano Ano Ano Ano Ano, pouze ke čtení Ne Čtenář: 1
Spisovatel: 2
Datové toky Ano Ano Ano Ne Ano Ano Ano, jen pro čtení Ne Čtenář: 1
Spisovatel: 2
Datové kanály Ne Ne Ano Ne Ano, přepsat pouze Ano Ano, jen pro čtení Ne Čtenář: 1
Spisovatel: 2
Sémantické modely Power BI Direct Lake Ano Ano N/A (není použitelné) Nelze použít Není k dispozici (není k dispozici) Ano Ano Ne Nepoužitelné (nevztahuje se)
Export sémantických modelů Power BI do OneLake Ano Nepoužitelné (neaplikovatelné) Ano Ne Ano Nevztahuje se Ne Ne Čtenář: 2
Spisovatel: 5
Databáze KQL Ano Ano Ne Žádné* Ano Ano Ne Ne Čtenář: 1
Zapisovač: 1
Eventstreams Ne Ne Ne Ne Ano Nevztahuje se (nevztahuje se) Ne Ne Čtenář: 1
Spisovatel: 2

* databáze KQL poskytují určité možnosti údržby tabulek, jako je uchovávání. Data se odeberou na konci doby uchovávání z OneLake. Další informace naleznete v tématu Jedna logická kopie.

Poznámka

  • Systém Fabric ve výchozím nastavení nezapisuje mapování pojmenovaných sloupců. Výchozí prostředí Fabric generuje tabulky, které jsou kompatibilní napříč službou. Delta Lake, vytvořené službami třetích stran, může mít nekompatibilní funkce tabulek.
  • Některé funkce platformy Fabric nemají zděděné možnosti optimalizace a údržby tabulek, jako jsou komprese datových bloků, řazení ve formátu V a vyčištění starých neodkazovaných souborů. Pokud chcete tabulky Delta Lake udržovat optimální pro analýzy, postupujte podle technik v Použití funkce údržby tabulek ke správě rozdílových tabulek v prostředí Fabric pro tabulky ingestované pomocí těchto zkušeností.

Aktuální omezení

Fabric v současné době nepodporuje tyto funkce Delta Lake:

  • Delta Lake 3.x Uniform
  • Zápis identitních sloupců (proprietární funkce Databricks)
  • Delta Live Tables (proprietární funkce Databricks)
  • RLE (kódování délek běhů) je povoleno v souboru kontrolního bodu