Zrcadlení katalogu Azure Databricks Unity (Preview)
Mnoho organizací dnes zaregistruje svá data v Katalogu Unity v Azure Databricks. Zrcadlený katalog Unity v prostředcích infrastruktury umožňuje zákazníkům číst data spravovaná katalogem Unity z úloh Fabric. Azure Databricks a Prostředky infrastruktury jsou společně lepší.
Kurz konfigurace pracovního prostoru Azure Databricks pro zrcadlení katalogu Unity do prostředků infrastruktury najdete v tématu Kurz: Konfigurace zrcadlených databází Microsoft Fabric z Azure Databricks (Preview)
Zrcadlené databáze v prostředcích infrastruktury umožňují uživatelům využívat vysoce integrovaný, ucelený a snadno použitelný produkt, který je navržený tak, aby zjednodušoval potřeby analýzy. Můžete si vychutnat snadno použitelný produkt navržený tak, aby zjednodušil vaše analytické potřeby a vytvořil pro otevřenost a spolupráci mezi Microsoft Fabric a Azure Databricks.
Pokud ke čtení dat zaregistrovaných v katalogu Unity použijete prostředky infrastruktury, nedojde k žádnému přesunu dat ani replikaci dat. Pouze struktura katalogu Azure Databricks se zrcadlí do prostředků infrastruktury a k podkladovým datům katalogu se přistupuje prostřednictvím zástupců. Proto se všechny změny v datech projeví okamžitě v prostředcích infrastruktury.
Jaká analytická prostředí jsou integrovaná
Zrcadlené katalogy jsou položka v prostředcích infrastruktury Skladování Dat odlišná od koncového bodu služby Warehouse a SQL Analytics.
Při zrcadlení katalogu Azure Databricks Unity vytvoří fabric tři položky:
- Zrcadlová položka Azure Databricks
- Koncový bod analýzy SQL v Lakehouse
- Výchozí sémantický model
K zrcadleným datům Azure Databricks můžete přistupovat několika způsoby:
- Každá zrcadlená položka Azure Databricks má automaticky vygenerovaný koncový bod analýzy SQL, který poskytuje bohaté analytické prostředí vytvořené procesem zrcadlení. Příkazy T-SQL slouží k definování a dotazování datových objektů z koncového bodu analýzy SQL jen pro čtení.
- Pomocí Power BI s režimem Direct Lake můžete vytvářet sestavy s položkou Azure Databricks.
Synchronizace metadat
Při vytváření nové zrcadlené databáze z Azure Databricks v prostředcích infrastruktury je ve výchozím nastavení povolená možnost Automaticky synchronizovat budoucí změny katalogu pro vybrané schéma . Pokud je povolená automatická synchronizace, projeví se následující změny metadat z pracovního prostoru Azure Databricks do prostředků infrastruktury:
- Přidání schémat do katalogu
- Odstranění schémat z katalogu
- Přidání tabulek do schématu
- Odstranění tabulek ze schématu
Výběr schématu nebo tabulky:
- Ve výchozím nastavení je vybrán celý katalog, když uživatel přidá katalog.
- Uživatel může vyloučit určité tabulky v rámci schématu.
- Zrušení výběru schématu zruší výběr všech tabulek v rámci schématu.
- Pokud se uživatel vrátí a vybere schéma, budou znovu vybrány všechny tabulky v rámci schématu.
- Stejné chování výběru platí pro schémata v katalogu.
Na katalogy, schémata a tabulky se použijí další podmínky filtrace:
- Materializovaná zobrazení a streamované tabulky se nezobrazí.
- Externí tabulky, které nepodporují formát Delta, se nezobrazí.