Protokoly Delta Lake ve skladu v Microsoft Fabric
Platí pro:✅ Warehouse v Microsoft Fabric
Sklad v Microsoft Fabric se sestavuje ve formátech otevřených souborů. Uživatelské tabulky jsou uložené ve formátu souborů parquet a protokoly Delta Lake se publikují pro všechny uživatelské tabulky.
Protokoly Delta Lake otevírají přímý přístup k uživatelským tabulkám skladu pro jakýkoli modul, který může číst tabulky Delta Lake. Tento přístup je omezen jen pro čtení, aby se zajistilo, že uživatelská data udržují dodržování předpisů transakcí ACID. Všechna vložení, aktualizace a odstranění dat v tabulkách se musí spouštět prostřednictvím skladu. Po potvrzení transakce se zahájí proces na pozadí systému, který publikuje aktualizovaný protokol Delta Lake pro ovlivněné tabulky.
Jak získat cestu OneLake
Následující postup podrobně popisuje, jak získat cestu OneLake z tabulky ve skladu:
Otevřete Sklad v pracovním prostoru Microsoft Fabric.
V Průzkumník objektů najdete další možnosti (...) ve vybrané tabulce ve složce Tabulky. Vyberte nabídku Vlastnosti.
Při výběru se v podokně Vlastnosti zobrazí následující informace:
- Název
- Formát
- Typ
- Adresa URL
- Relativní cesta
- Cesta ABFS
Jak získat cestu k protokolům Delta Lake
Protokoly Delta Lake můžete najít pomocí následujících metod:
Protokoly Delta Lake se dají dotazovat prostřednictvím zástupců vytvořených v jezeře. Soubory můžete zobrazit pomocí poznámkového bloku Microsoft Fabric Spark nebo průzkumníka Lakehouse v prostředcích infrastruktury Datoví technici na portálu Microsoft Fabric.
Protokoly Delta Lake najdete prostřednictvím Průzkumník služby Azure Storage, prostřednictvím připojení Sparku, jako je režim Direct Lake Power BI, nebo pomocí jakékoli jiné služby, která může číst tabulky delta.
Protokoly Delta Lake najdete ve
_delta_log
složce každé tabulky prostřednictvím Průzkumníka OneLake ve Windows, jak je znázorněno na následujícím snímku obrazovky.
Pozastavení publikování protokolů Delta Lake
Publikování protokolů Delta Lake je možné v případě potřeby pozastavit a obnovit. Při pozastavení publikování moduly Microsoft Fabric, které čtou tabulky mimo sklad, uvidí data tak, jak byla před pozastavením. Zajišťuje, aby sestavy zůstaly stabilní a konzistentní a odrážely data ze všech tabulek, jak existovaly před provedením jakýchkoli změn v tabulkách. Po dokončení aktualizací dat můžete pokračovat v publikování protokolu Delta Lake, aby se všechny nedávné změny dat zobrazovaly ostatním analytickým modulům. Dalším případem použití pro pozastavení publikování protokolů Delta Lake je, když uživatelé nepotřebují interoperabilitu s jinými výpočetními moduly v Microsoft Fabric, protože to může pomoct ušetřit náklady na výpočetní prostředky.
Syntaxe pozastavení a obnovení publikování protokolů Delta Lake je následující:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = PAUSED | AUTO
Příklad: Pozastavení a obnovení publikování protokolů Delta Lake
Pokud chcete pozastavit publikování protokolu Delta Lake, použijte následující fragment kódu:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = PAUSED
Dotazy na tabulky skladu v aktuálním skladu z jiných modulů Microsoft Fabric (například dotazů z Lakehouse) teď zobrazují verzi dat, jak byla před pozastavením publikování protokolů Delta Lake. Dotazy na sklad stále zobrazují nejnovější verzi dat.
Pokud chcete obnovit publikování protokolů Delta Lake, použijte následující fragment kódu:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = AUTO
Když se stav změní zpět na AUTO, modul Fabric Warehouse publikuje protokoly všech nedávných změn provedených v tabulkách ve skladu, což ostatním analytickým modulům v Microsoft Fabric umožňuje číst nejnovější verzi dat.
Kontrola stavu publikování protokolů Delta Lake
Pokud chcete zkontrolovat aktuální stav publikování protokolů Delta Lake ve všech skladech pro aktuální pracovní prostor, použijte následující fragment kódu:
SELECT [name], [DATA_LAKE_LOG_PUBLISHING_DESC] FROM sys.databases
Omezení
- Názvy tabulek můžou používat jen Spark a další systémy, pokud obsahují jenom tyto znaky: A-Z a-z 0-9 a podtržítka.
- Názvy sloupců, které budou používat Spark a jiné systémy, nesmí obsahovat:
- mezery
- karty
- návraty na začátek řádku
- [
- ,
- ;
- {
- }
- (
- )
- =
- ]