Použití kanálů Delta Live Tables se starší verzí metastoru Hive
Tento článek podrobně popisuje konfigurace a upozornění specifické pro kanály Delta Live Tables nakonfigurované pro publikování dat do staršího metastoru Hive. Databricks doporučuje používat katalog Unity pro všechny nové kanály. Podívejte se na Použití katalogu Unity s pipelinami Delta Live Tables.
Poznámka
Tento článek popisuje funkcionalitu pro aktuální výchozí režim publikování pro potrubí. Kanály vytvořené před 5. únorem 2025 můžou používat starší režim publikování a LIVE
virtuální schéma. Viz LIVE schema (starší verze).
Dotazování streamovaných tabulek a materializovaných zobrazení ve starším metastoru Hive
Po dokončení aktualizace můžete zobrazit schéma a tabulky, dotazovat se na data nebo použít data v podřízených aplikacích.
Po publikování se tabulky Delta Live Tables dají dotazovat z libovolného prostředí s přístupem k cílovému schématu. To zahrnuje Databricks SQL, poznámkové bloky a další kanály Delta Live Tables.
Důležité
Při vytváření konfigurace target
se publikují pouze tabulky a přidružená metadata. Zobrazení se nepublikují do metastoru.
Konfigurace kanálu pro publikování do metastoru Hive
Při vytváření nového kanálu můžete v části Možnosti úložiště zadat metastoru Hive, kam se má publikovat do staršího metastoru Hive. Při publikování do metastoru Hive musíte zadat výchozí cílové schéma. Viz Konfigurace potrubí Delta Live Tables.
Určení umístění úložiště
Můžete zadat umístění úložiště pro kanál, který publikuje do metastoru Hive. Primární motivací pro určení umístění je řídit umístění úložiště objektů pro data zapsaná kanálem. Databricks doporučuje vždy konkrétní umístění úložiště, aby se zabránilo zápisu do kořenového adresáře DBFS.
Vzhledem k tomu, že všechny tabulky, data, kontrolní body a metadata pro pipelines Delta Live Tables jsou plně spravovány Delta Live Tables, většina interakcí s datovými sadami Delta Live Tables probíhá prostřednictvím tabulek registrovaných v Hive metastoru nebo v Unity katalogu.
Konfigurace cloudového úložiště
Pokud chcete získat přístup k azure Storage, musíte nakonfigurovat požadované parametry, včetně přístupových tokenů, pomocí nastavení spark.conf
v konfiguracích clusteru. Příklad konfigurace přístupu k účtu úložiště Azure Data Lake Storage Gen2 (ADLS Gen2) najdete v tématu Zabezpečený přístup k přihlašovacím údajům úložiště s tajnými kódy v kanálu.
Ukázkové poznámkové bloky zdrojového kódu pro data pipelines v pracovních prostorech bez Unity Catalogu
Následující poznámkové bloky můžete importovat do pracovního prostoru Azure Databricks bez zapnutého katalogu Unity a použít je k nasazení pipeline Delta Live Tables. Importujte poznámkový blok vybraného jazyka a při konfiguraci kanálu s možností úložiště metastoru Hive zadejte cestu do pole Zdrojový kód. Viz Konfigurace potrubí Delta Live Tables.
Začínáme s poznámkovým blokem Delta Live Tables v Pythonu
Pořiďte si poznámkový blok
Začínáme s notebookem SQL Delta Live Tables
Pořiďte si poznámkový blok