Freigeben über


Spiegelung von Azure Databricks Unity Catalog (Vorschau)

Zahlreiche Organisationen registrieren ihre Daten heutzutage in Unity Catalog in Azure Databricks. Mit einer gespiegelten Unity Catalog-Instanz in Fabric können Kunden Daten, die von Unity Catalog verwaltet werden, aus Fabric-Workloads lesen. Azure Databricks und Fabric sind zusammen besser.

Ein Tutorial zum Konfigurieren Ihres Azure Databricks-Arbeitsbereichs für die Spiegelung der Unity Catalog-Instanz in Fabric finden Sie unter Tutorial: Konfigurieren von in Microsoft Fabric gespiegelten Datenbanken aus Azure Databricks (Vorschau).

Gespiegelte Datenbanken in Fabric bieten Benutzern ein hochgradig integriertes, umfassendes und benutzerfreundliches Produkt, das auf die vereinfachte Verwaltung von Analysen ausgelegt ist. Sie können ein benutzerfreundliches Produkt nutzen, das für die vereinfachte Verwaltung von Analysen entwickelt wurde und auf Offenheit und Zusammenarbeit zwischen Microsoft Fabric und Azure Databricks ausgelegt ist.

Wenn Sie Fabric zum Lesen von Daten verwenden, die in Unity Catalog registriert sind, erfolgt keine Datenverschiebung oder Datenreplikation. Nur die Azure Databricks-Katalogstruktur wird in Fabric gespiegelt, und auf die zugrunde liegenden Katalogdaten wird über Verknüpfungen zugegriffen. Daher werden alle Datenänderungen sofort in Fabric widergespiegelt.

Welche Analyseumgebungen sind integriert?

Gespiegelte Kataloge sind ein Element in Fabric-Datenspeicherung, die sich von Warehouse- und SQL-Analyseendpunkten unterscheiden.

Wenn Sie eine Azure Databricks Unity Catalog-Instanz spiegeln, erstellt Fabric drei Elemente:

Sie haben mehrere Möglichkeiten, auf die gespiegelten Azure Databricks-Daten zuzugreifen:

  • Jedes gespiegelte Azure Databricks-Element verfügt über einen automatisch generierten SQL-Analyseendpunkt, der umfassende Analysefunktionen bietet, die vom Spiegelungsprozess erstellt wurden. Verwenden Sie T-SQL-Befehle, um Datenobjekte zu definieren und vom schreibgeschützten SQL-Analyseendpunkt abzufragen.
  • Verwenden Sie Power BI mit Direct Lake-Modus, um Berichte für das Azure Databricks-Element zu erstellen.

Synchronisierung von Metadaten

Wenn Sie eine neue gespiegelte Datenbank aus Azure Databricks in Fabric erstellen, ist standardmäßig die Option Zukünftige Katalogänderungen für das ausgewählte Schema automatisch synchronisieren aktiviert. Die folgenden Metadatenänderungen werden von Ihrem Azure Databricks-Arbeitsbereich in Fabric widergespiegelt, wenn die automatische Synchronisierung aktiviert ist:

  • Hinzufügen von Schemas zu einem Katalog
  • Löschen von Schemas aus einem Katalog
  • Hinzufügen von Tabellen zu einem Schema
  • Löschen von Tabellen aus einem Schema

Schema-/Tabellenauswahl:

  • Standardmäßig wird der gesamte Katalog ausgewählt, wenn der Benutzer den Katalog hinzufügt.
  • Der Benutzer kann bestimmte Tabellen innerhalb des Schemas ausschließen.
  • Wenn Sie die Auswahl eines Schemas aufheben, wird die Auswahl aller Tabellen im Schema aufgehoben.
  • Wenn der Benutzer zurückgeht und das Schema auswählt, werden alle Tabellen innerhalb des Schemas erneut ausgewählt.
  • Das gleiche Auswahlverhalten gilt für Schemas innerhalb eines Katalogs.

Es gibt weitere Filterbedingungen, die auf Kataloge/Schemas/Tabellen angewendet werden:

  • Materialisierte Sichten und Streamingtabellen werden nicht angezeigt.
  • Externe Tabellen, die das Delta-Format nicht unterstützen, werden nicht angezeigt.