Sdílet prostřednictvím


Dostupnost Eventhouse OneLake

V událostním úložišti můžete vytvořit logickou kopii dat databáze KQL zapnutím přístupnosti OneLake. Zapnutí dostupnosti OneLake znamená, že můžete dotazovat data v databázi KQL ve formátu Delta Lake prostřednictvím jiných modulů Infrastruktury, jako je režim Direct Lake v Power BI, Warehouse, Lakehouse, Notebooks a další.

Delta Lake je jednotný formát tabulky Data Lake, který umožňuje bezproblémový přístup k datům napříč všemi výpočetními moduly v Microsoft Fabric. Další informace o Delta Lake najdete v tématu Co je Delta Lake?.

V tomto článku se dozvíte, jak zapnout dostupnost databázových dat KQL ve OneLake.

Jak to funguje

Můžete zapnout dostupnost OneLake na úrovni databáze nebo tabulky. Pokud je tato možnost povolená na úrovni databáze, zpřístupní se všechny nové tabulky a jejich data ve OneLake. Při zapnutí této funkce můžete také zvolit, jestli chcete tuto možnost použít u existujících tabulek, a to tak, že vyberete možnost Použít u existujících tabulek. Zapnutím na úrovni tabulky zpřístupníte pouze tuto tabulku a její data ve OneLake. Zásady uchovávání dat databáze KQL se také použijí na data v OneLake. Data odebraná z databáze KQL na konci doby uchovávání se také odeberou z OneLake. Pokud vypnete dostupnost OneLake, data budou z OneLake mírně odstraněna.

Pokud je dostupnost OneLake zapnuta, nemůžete provádět následující úlohy:

  • Přejmenování tabulek
  • Změnit schémata tabulky
  • Použití zabezpečení na úrovni řádků u tabulek
  • Data nejde odstranit, zkrátit ani vymazat

Pokud potřebujete provést některou z těchto úloh, postupujte následovně:

Důležité

Vypnutím dostupnosti OneLake soft mazání odstraní vaše data z OneLake. Když znovu zapnete dostupnost, zpřístupní se v OneLake pouze nová data bez obnovení odstraněných dat.

  1. Vypněte dostupnost OneLake .

  2. Proveďte požadovanou úlohu.

  3. Zapněte dostupnost OneLake.

Důležité

Další informace o době, která trvá, než se data objeví ve OneLake, najdete v tématu Adaptivní chování.

Za zapnutí dostupnosti OneLake nejsou žádné další náklady na úložiště. Další informace najdete v tématu o spotřebě prostředků.

Požadavky

Zapnutí dostupnosti OneLake

Dostupnost OneLake můžete zapnout buď na úrovni databáze KQL, nebo tabulky.

  1. Dostupnost OneLake zapnete tak, že v podokně podrobností databáze nebo tabulky KQL přejdete do části OneLake.

  2. Nastavte dostupnost na Zapnuto.

    snímek obrazovky sekce OneLake v podokně podrobností databáze, kde je zvýrazněná možnost Dostupnost

  3. Databáze se aktualizuje automaticky.

    snímek obrazovky s podrobnostmi oddílu OneLake v Real-Time Intelligence, jakmile je dostupnost nastavená na Zapnuto. Možnost zveřejnit data pro OneLake je zapnutá.

V databázi KQL jste zapnuli dostupnost OneLake. Teď máte přístup ke všem novým datům přidaných do databáze na dané cestě OneLake ve formátu Delta Lake. Můžete také vytvořit zástupce OneLake z Lakehouse, Data Warehouse nebo dotazovat data přímo v režimu Power BI Direct Lake.

Adaptivní chování

Eventhouse nabízí robustní mechanismus, který inteligentně dávková příchozí datové proudy do jednoho nebo více souborů Parquet strukturovaných pro analýzu. Dávkování datových proudů je důležité při práci s podvodnými daty. Zápis mnoha malých souborů Parquet do jezera může být neefektivní, což vede k vyšším nákladům a nízkému výkonu.

Adaptivní mechanismus eventhouse může zpozdit operace zápisu, pokud není dostatek dat k vytvoření optimálních souborů Parquet. Tím se zajistí optimální velikost souborů Parquet a dodržování osvědčených postupů pro Delta Lake. Adaptivní mechanismus Eventhouse zajišťuje, aby soubory Parquet byly předváděny pro analýzu a vyrovnává potřebu dostupnosti dat s ohledem na náklady a výkon.

Poznámka:

  • Ve výchozím nastavení může operace zápisu trvat až 3 hodiny nebo až do vytvoření souborů s dostatečnou velikostí (obvykle 200–256 MB).
  • Zpoždění můžete upravit na hodnotu mezi 5 minutami a 3 hodinami.

K nastavení zpoždění na 5 minut použijte například následující příkaz:

.alter-merge table <TableName> policy mirroring dataformat=parquet with (IsEnabled=true, TargetLatencyInMinutes=5);

Opatrnost

Úprava zpoždění na kratší dobu může vést k neoptimální delta tabulce s velkým počtem malých souborů, což může způsobit neefektivní výkon dotazů. Výsledná tabulka ve OneLake je jen pro čtení a po vytvoření ji nejde optimalizovat.

Pomocí příkazu .show table mirroring operations můžete sledovat, jak dlouho uplynulo od přidání nových dat do jezera.

Výsledky se měří od posledního přidání dat. Pokud latence způsobí 00:00:00, všechna data v databázi KQL jsou k dispozici ve OneLake.

Prohlížení souborů

Když zapnete dostupnost OneLake v tabulce, vytvoří se spolu s odpovídajícími soubory JSON a Parquet složka s rozdílovým protokolem. Můžete zobrazit soubory, které byly zpřístupněny ve OneLake, a jejich vlastnosti a zůstat v reálném čase.

  • Chcete-li zobrazit soubory, najeďte myší na tabulku v podokně Průzkumník a pak vyberte nabídku Další [...]>Umožňuje zobrazit soubory.

    Snímek obrazovky s podoknem Průzkumníka s rozevíracím seznamem Nabídky Další v tabulce

  • Pokud chcete zobrazit vlastnosti složky rozdílového protokolu nebo jednotlivých souborů, najeďte myší na složku nebo soubor a pak vyberte nabídku Další [...]>Vlastnosti.

  • Zobrazení souborů ve složce rozdílového protokolu:

    1. Vyberte složku _delta_log.
    2. Výběrem souboru zobrazíte metadata a schéma tabulky. Editor, který se otevře, je ve formátu jen pro čtení.

Zásady zrcadlení přístupu

Pokud je ve výchozím nastavení zapnutá dostupnost OneLake, povolí se zásada zrcadlení. Zásady můžete použít k monitorování latence dat nebo k jejich změně na rozdílové tabulky oddílů.

Poznámka:

Pokud vypnete dostupnost OneLake, vlastnost zásady IsEnabled zrcadlení je nastavená na false (IsEnabled=false).

Rozdílové tabulky oddílů

Rozdílové tabulky můžete rozdělit tak, aby se zlepšila rychlost dotazů. Informace o tom, kdy rozdělit soubory OneLake, naleznete v tématu Kdy rozdělit tabulky. Každý oddíl je reprezentován jako samostatný sloupec pomocí Názvu oddílu uvedeného v seznamu Oddíly. To znamená, že vaše kopie OneLake má více sloupců než zdrojová tabulka.

K rozdělení tabulek delta použijte příkaz zrcadlení zásad tabulky .alter-merge.