Dostupnost Eventhouse OneLake
V objektu událostí můžete vytvořit jednu logickou kopii dat databáze KQL zapnutím dostupnosti OneLake. Zapnutí dostupnosti OneLake znamená, že můžete dotazovat data v databázi KQL ve formátu Delta Lake prostřednictvím jiných modulů Infrastruktury, jako je režim Direct Lake v Power BI, Warehouse, Lakehouse, Notebooks a další.
Delta Lake je jednotný formát tabulky Data Lake, který umožňuje bezproblémový přístup k datům napříč všemi výpočetními moduly v Microsoft Fabric. Další informace o Delta Lake najdete v tématu Co je Delta Lake?.
V tomto článku se dozvíte, jak zapnout dostupnost dat databáze KQL ve OneLake.
Jak to funguje
Následující tabulka popisuje chování databáze a tabulek KQL při zapnutí nebo vypnutí dostupnosti OneLake.
Zapnutý | Vypnuto | |
---|---|---|
Databáze KQL | – Stávající tabulky nejsou ovlivněné. Nové tabulky jsou dostupné ve OneLake. – Zásady uchovávání dat databáze KQL se použijí také na data v OneLake. Data odebraná z databáze KQL na konci doby uchovávání se také odeberou z OneLake. |
– Stávající tabulky nejsou ovlivněné. Nové tabulky nebudou ve OneLake dostupné. |
Tabulka v databázi KQL | - Nová data jsou k dispozici ve OneLake. – Existující data se nevyplní. – Data nelze odstranit, zkrátit ani vymazat. – Schéma tabulky nelze změnit a tabulku nelze přejmenovat. – U tabulky nelze použít zabezpečení na úrovni řádků. |
– Ve OneLake nejsou k dispozici nová data. – Data lze odstranit, zkrátit nebo vymazat. – Schéma tabulky lze změnit a tabulku lze přejmenovat. - Data se z OneLake odstraní. |
Důležité
Zobrazení dat ve OneLake může trvat až několik hodin. Další informace naleznete v tématu Adaptivní chování.
Za zapnutí dostupnosti OneLake nejsou žádné další náklady na úložiště. Další informace najdete v tématu o spotřebě prostředků.
Požadavky
- Pracovní prostor s kapacitou s podporou Microsoft Fabric
- Databáze KQL s oprávněními pro úpravy a dat
Zapnutí dostupnosti OneLake
Dostupnost OneLake můžete zapnout buď na úrovni databáze KQL, nebo tabulky.
Dostupnost OneLake zapnete tak, že v podokně podrobností databáze nebo tabulky KQL přejdete do části OneLake.
Nastavte dostupnost na Zapnuto.
Databáze se aktualizuje automaticky.
V databázi KQL jste zapnuli dostupnost OneLake. Teď máte přístup ke všem novým datům přidaných do databáze na dané cestě OneLake ve formátu Delta Lake. Můžete také vytvořit zástupce OneLake z Lakehouse, Data Warehouse nebo dotazovat data přímo v režimu Power BI Direct Lake.
Adaptivní chování
Eventhouse nabízí robustní mechanismus, který inteligentně dávková příchozí datové proudy do jednoho nebo více souborů Parquet strukturovaných pro analýzu. Dávkování datových proudů je důležité při práci s podvodnými daty. Zápis mnoha malých souborů Parquet do jezera může být neefektivní, což vede k vyšším nákladům a nízkému výkonu.
Adaptivní mechanismus eventhouse může zpozdit operace zápisu až na několik hodin, pokud není dostatek dat k vytvoření optimálních souborů Parquet. Tím se zajistí optimální velikost souborů Parquet a dodržování osvědčených postupů pro Delta Lake. Adaptivní mechanismus Eventhouse zajišťuje, aby soubory Parquet byly předváděny pro analýzu a vyrovnává potřebu dostupnosti dat s ohledem na náklady a výkon.
Pomocí příkazu .show table mirroring operations můžete monitorovat, jak dlouho byla v jezeře přidána nová data.
Výsledky se měří od posledního přidání dat. Pokud latence způsobí 00:00:00, všechna data v databázi KQL jsou k dispozici ve OneLake.
Prohlížení souborů
Když zapnete dostupnost OneLake v tabulce, vytvoří se spolu s odpovídajícími soubory JSON a Parquet složka s rozdílovým protokolem. Můžete zobrazit soubory, které byly zpřístupněny ve OneLake, a jejich vlastnosti a zůstat v reálném čase.
Chcete-li zobrazit soubory, najeďte myší na tabulku v podokně Průzkumník a pak vyberte nabídku Další [...]>Umožňuje zobrazit soubory.
Pokud chcete zobrazit vlastnosti složky rozdílového protokolu nebo jednotlivých souborů, najeďte myší na složku nebo soubor a pak vyberte nabídku Další [...]>Vlastnosti.
Zobrazení souborů ve složce rozdílového protokolu:
- Vyberte složku _delta_log.
- Výběrem souboru zobrazíte metadata a schéma tabulky. Editor, který se otevře, je ve formátu jen pro čtení.
Zásady zrcadlení přístupu
Pokud je ve výchozím nastavení zapnutá dostupnost OneLake, povolí se zásada zrcadlení. Zásady můžete použít k monitorování latence dat nebo k jejich změně na rozdílové tabulky oddílů.
Poznámka:
Pokud vypnete dostupnost OneLake, vlastnost zásady IsEnabled
zrcadlení je nastavená na false (IsEnabled=false
).
Rozdílové tabulky oddílů
Rozdílové tabulky můžete rozdělit tak, aby se zlepšila rychlost dotazů. Informace o tom, kdy rozdělit soubory OneLake, naleznete v tématu Kdy rozdělit tabulky. Každý oddíl je reprezentován jako samostatný sloupec pomocí Názvu oddílu uvedeného v seznamu Oddíly. To znamená, že vaše kopie OneLake má více sloupců než zdrojová tabulka.
K rozdělení tabulek delta použijte příkaz zrcadlení zásad tabulky .alter-merge.
Související obsah
- Pokud chcete zveřejnit data v Aplikaci OneLake, přečtěte si téma Vytvoření zástupce ve OneLake.
- Pokud chcete vytvořit zástupce OneLake v Lakehouse, přečtěte si téma Co jsou klávesové zkratky v lakehouse?
- Pokud chcete dotazovat odkazovaná data z OneLake v databázi nebo tabulce KQL, přečtěte si téma Vytvoření zástupce OneLake v databázi KQL.