Was ist Spiegelung in Fabric?

Artikel
11/21/2024

Die Spiegelung in Fabric eine kostengünstige Lösung mit geringer Latenz, um Daten aus verschiedenen Systemen in einer einzigen Analyseplattform zu vereinen. Sie können Ihren vorhandenen Datenbestand kontinuierlich direkt aus einer Vielzahl von Azure-Datenbanken und externen Datenquellen in Fabric OneLake replizieren.

Mit den aktuellsten Daten in einem abfragefähigen Format in OneLake können Sie jetzt alle verschiedenen Dienste in Fabric verwenden, z. B. Ausführung von Analysen mit Spark, Ausführung von Notebooks, Datentechnik, Visualisierung über Power BI-Berichte und vieles mehr.

Spiegeln in Fabric bietet Benutzern ein hochgradig integriertes, umfassendes und benutzerfreundliches Produkt nutzen, das auf die vereinfachte Verwaltung von Analysen ausgelegt ist. Für Offenheit und Zusammenarbeit zwischen Microsoft und Technologielösungen entwickelt, die das Open-Source-Delta Lake-Tabellenformat lesen können, ist die Spiegelung eine kostengünstige und low-latency Turnkey-Lösung, mit der Sie ein Replikat Ihrer Daten in OneLake erstellen können, das für alle Ihre analytischen Anforderungen verwendet werden kann.

Die Delta-Tabellen können dann überall in Fabric verwendet werden, wodurch Benutzer ihre Reise in Fabric beschleunigen können.

Gründe für die Verwendung von Spiegelung in Fabric.

Heute verfügen viele Organisationen über unternehmenskritische oder analytische Daten, die in Silos sitzen.

Für den Zugriff und die Arbeit mit diesen Daten sind komplexe ETL-Pipelines (Extract Transform Load), Geschäftsprozesse und Entscheidungssilos erforderlich, mit folgenden Nachteilen:

Eingeschränkter und beschränkter Zugriff auf wichtige, sich ständig ändernde Daten
Reibung zwischen Menschen, Prozessen und Technologien
Lange Wartezeiten zum Erstellen von Datenpipelinen und Prozessen zu kritisch wichtigen Daten
Keine Freiheit, die Tools zu verwenden, die Sie benötigen, um Einblicke bequem zu analysieren und zu teilen
Mangel an einer richtigen Grundlage für Mitarbeiter, um Daten zu teilen und zusammenzuarbeiten
Keine gängigen, offenen Datenformate für alle analytischen Szenarien – BI, AI, Integration, Engineering und sogar Apps

Die Spiegelung in Fabric ermöglicht es, Erkenntnisse und Entscheidungen schneller zu nutzen und Datensilos zwischen Technologielösungen zu beseitigen:

Quasi-Echtzeit-Replikation von Daten und Metadaten in einen SaaS-Data-Lake mit integrierter Analyse für BI und KI

Die Platform Microsoft Fabric basiert auf der Grundlage von Software as a Service (SaaS), die Einfachheit und Integration auf ein völlig neues Niveau hebt. Weitere Informationen zu Microsoft Fabric finden Sie unter Was ist Microsoft Fabric?

Die Spiegelung erstellt drei Elemente in Ihrem Fabric-Arbeitsbereich:

Die Spiegelung verwaltet die Replikation von Daten und Metadaten in OneLake und die Konvertierung in Parquet, ein analysefähiges Format. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und mehr.
Ein SQL-Analyseendpunkt
Ein Standardsemantikmodell

Zusätzlich zum SQL Query Editor gibt es ein breites Ökosystem, einschließlich SQL Server Management Studio (SSMS), der mssql-Erweiterung mit Visual Studio Code und sogar GitHub Copilot.

Teilen ermöglicht die erleichterte Zugriffssteuerung und -verwaltung, um sicherzustellen, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Teilen ermöglicht auch sichere und demokratisierte Entscheidungsfindung in Ihrer gesamten Organisation.

Arten der Spiegelung

Fabric bietet drei verschiedene Ansätze, um Daten durch Spiegelung in OneLake zu bringen.

Datenbankspiegelung: Die Datenbankspiegelung in Microsoft Fabric ermöglicht die Replikation ganzer Datenbanken und Tabellen, sodass Sie Daten aus verschiedenen Systemen in einer einzigen Analyseplattform vereinen können.
Metadatenspiegelung: Die Metadatenspiegelung in Fabric synchronisiert Metadaten (z. B. Katalognamen, Schemas und Tabellen), anstatt die Daten tatsächlich zu verschieben. Dieser Ansatz nutzt Verknüpfungen, um sicherzustellen, dass die Daten in ihrer Quelle verbleiben und gleichzeitig in Fabric leicht zugänglich sind.
Offene Spiegelung: Die offene Spiegelung in Fabric wurde entwickelt, um die Spiegelung basierend auf dem offenen Delta Lake-Tabellenformat zu erweitern. Mit dieser Funktion können Entwickler die Änderungsdaten ihrer Anwendung direkt in ein gespiegeltes Datenbankelement in Microsoft Fabric schreiben, basierend auf dem Ansatz für die offene Spiegelung und den öffentlichen APIs.

Derzeit sind die folgenden externen Datenbanken verfügbar:

Plattform	Replikation in Quasi-Echtzeit	Spiegelungsart	End-to-End-Tutorial
Spiegeldatenbanken in Microsoft Fabric von Azure Cosmos DB (Vorschau)	Ja	Spiegeln von Datenbanken	Lernprogramm: Azure Cosmos DB
Gespiegelte Microsoft Fabric-Datenbanken aus Azure Databricks (Vorschau)	Ja	Metadatenspiegelung	Tutorial: Azure Databricks
Gespiegelte Datenbanken in Microsoft Fabric aus Azure SQL-Datenbank	Ja	Spiegeln von Datenbanken	Lernprogramm: Azure SQL-Datenbank
Gespiegelte Microsoft Fabric-Datenbanken aus Azure SQL Managed Instance (Vorschau)	Ja	Spiegeln von Datenbanken	Tutorial: Azure SQL Managed Instance
Gespiegelte Datenbanken in Microsoft Fabric aus Snowflake	Ja	Spiegeln von Datenbanken	Lernprogramm: Snowflake
Öffnen von gespiegelten Datenbanken (Vorschau)	Ja	Offene Spiegelung	Tutorial: Offene Spiegelung
Gespiegelte Microsoft Fabric-Datenbanken aus der Fabric-SQL-Datenbank (Vorschau)	Ja	Spiegeln von Datenbanken	Automatisch konfiguriert

Wie funktioniert die Quasi-Echtzeit-Replikation der Datenbankspiegelung?

Die Spiegelung wird durch Erstellen einer sicheren Verbindung mit Ihrer betrieblichen Datenquelle aktiviert. Sie wählen aus, ob eine gesamte Datenbank oder einzelne Tabellen repliziert werden soll und die Spiegelung wird Ihre Daten automatisch synchronisieren. Nach der Einrichtung werden die Daten kontinuierlich in OneLake für den Analyseverbrauch gespiegelt.

Im Folgenden sind die Kernprinzipien der Spiegelung aufgelistet:

Das Aktivieren der Spiegelung in Fabric ist einfach und intuitiv. Dazu müssen keine komplexeren ETL-Pipelines erstellt werden, weitere Computeressourcen zugeordnet oder Datenverschiebungen verwaltet werden.
Die Spiegelung in Fabric ist ein vollständig verwalteter Dienst, daher müssen Sie sich keine Gedanken über Hosting, Pflege oder die Verwaltung der Replikation der gespiegelten Verbindung machen.

Wie funktioniert die Metadatenspiegelung?

Die Spiegelung ermöglicht nicht nur die Datenreplikation, sondern kann auch durch Verknüpfungen oder Metadatenspiegelung statt durch vollständige Datenreplikation erreicht werden, sodass Daten verfügbar sind, ohne sie tatsächlich zu verschieben oder zu duplizieren. Die Spiegelung in diesem Kontext bezieht sich auf das Replizieren von Metadaten wie Katalognamen, Schemas und Tabellen und nicht auf die tatsächlichen Daten. Mit diesem Ansatz kann Fabric Daten aus verschiedenen Quellen zugänglich machen, ohne sie zu duplizieren, was die Datenverwaltung vereinfacht und die Speicheranforderungen minimiert.

Wenn Sie beispielsweise auf Daten zugreifen, die in Unity Catalog registriert sind, spiegelt Fabric nur die Katalogstruktur aus Azure Databricks wider, sodass auf die zugrunde liegenden Daten über Verknüpfungen zugegriffen werden kann. Diese Methode stellt sicher, dass alle Änderungen der Quelldaten sofort in Fabric widergespiegelt werden, ohne dass eine Datenverschiebung erforderlich ist, die Echtzeitsynchronisierung aufrechterhalten wird und die Effizienz beim Zugriff auf aktuelle Informationen verbessert wird.

Wie funktioniert die offene Spiegelung?

Die Spiegelung ermöglicht nicht nur die Datenreplikation durch Erstellen einer sicheren Verbindung mit Ihrer Datenquelle, sondern Sie können auch einen vorhandenen Datenanbieter auswählen oder Ihre eigene Anwendung schreiben, um Daten in gespiegelte Datenbank zu bringen. Sobald Sie eine offen gespiegelte Datenbank über eine öffentliche API oder über das Fabric-Portal erstellen, können Sie eine Zielzonen-URL in OneLake abrufen, in die Sie Daten pro offener Spiegelungsspezifikation bringen können.

Sobald sich Daten in der Zielzone mit dem richtigen Format befinden, wird die Replikation gestartet und verwaltet die Komplexität der Zusammenführung der Änderungen. Änderungs-, Einfüge- und Löschvorgänge werden in Deltatabellen kenntlich gemacht. Diese Methode stellt sicher, dass alle in die Zielzone geschriebenen Daten sofort verfügbar sind und die Daten in Fabric auf dem neuesten Stand bleiben.

Tilen ermöglicht die erleichterte Zugriffssteuerung und -verwaltung, während Sicherheitskontrollen wie Sicherheit auf Zeilenebene (RLS) und OLS (Object Level Security) und mehr sicherstellen, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Teilen ermöglicht auch sichere und demokratisierte Entscheidungsfindung in Ihrer gesamten Organisation.

Durch die Freigabe gewähren Benutzer*innen anderen Benutzer*innen oder einer Gruppe von Benutzer*innen Zugriff auf eine gespiegelte Datenbank, ohne Zugriff auf den Arbeitsbereich und die restlichen Elemente zu gewähren. Wenn eine Person eine gespiegelte Datenbanken freigibt, gewährt sie auch Zugriff auf den SQL-Endpunkt und das zugehörige Standardsemantikmodell.

Weitere Informationen finden Sie unter Freigeben Ihrer gespiegelten Datenbank und Verwalten von Berechtigungen.

Datenbankübergreifende Abfragen

Mit den Daten aus Ihrer gespiegelten Datenbank, die in OneLake gespeichert sind, können Sie datenbankübergreifende Abfragen schreiben, Daten aus gespiegelten Datenbanken, Lagerorten und den SQL-Analyseendpunkten von Lakehouses in einer einzigen T-SQL-Abfrage verknüpfen. Weitere Informationen finden Sie unter Schreiben einer datenbankübergreifenden Abfrage.

Sie können z. B. auf die Tabelle aus gespiegelte Datenbanken und Lagerorten mit dreiteiliger Benennung verweisen. Im folgenden Beispiel wird der dreiteilige Name verwendet, um im Lagerort ContosoSalesTable auf ContosoWarehouse zu verweisen. Aus anderen Datenbanken oder Lagerorten ist der erste Teil der standardmäßigen SQL-dreiteiligen Benennungskonvention der Name der gespiegelten Datenbank.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Datentechnik mit Ihren Daten aus gespiegelten Datenbanken

Microsoft Fabric bietet verschiedene Datentechnikfunktionen, um sicherzustellen, dass Ihre Daten leicht zugänglich, gut organisiert und von hoher Qualität sind. Von Fabric-Datentechnik aus bestehen folgende Möglichkeiten:

Erstellen und Verwalten Ihrer Daten als Spark mit einem Lakehouse
Entwerfen von Pipelines zum Kopieren von Daten in Ihr Lakehouse
Verwenden von Spark-Auftragsdefinitionen zum Übermitteln eines Batch-/Streamingauftrags an den Spark-Cluster
Verwenden von Notebooks zum Schreiben von Code für die Datenerfassung, -aufbereitung und -transformation

Data Science mit Ihren gespiegelte Datenbankdaten

Mit Microsoft Fabric können Benutzer komplette Fabric Data-Science-Workflows für die Datenanreicherung und für geschäftliche Erkenntnisse abschließen. Sie können eine Vielzahl von Aktivitäten im gesamten Data-Science-Prozess durchführen, unter anderem die Untersuchung, Aufbereitung und Bereinigung von Daten sowie Experimente, Modellierung, Modellbewertung, Bereitstellung von Vorhersageerkenntnissen und BI-Berichte (Business Intelligence).

Microsoft Fabric-Benutzer können auf Data Science-Arbeitslasten zugreifen. Dort können sie verschiedene relevante Ressourcen finden und auf sie zugreifen. Sie können beispielsweise mit maschinellem Lernen Experimente, Modelle und Notebooks erstellen. Sie können auch vorhandene Notebooks auf der Data-Science-Startseite importieren.

SQL-Datenbank in Fabric

Sie können auch direkt eine SQL-Datenbank in Microsoft Fabric (Vorschau) im Fabric-Portal erstellen und verwalten. Basierend auf Azure SQL-Datenbank wird die SQL-Datenbank in Fabric automatisch für Analysezwecke gespiegelt und ermöglicht Ihnen das einfache Erstellen Ihrer betriebsfähigen Datenbank in Fabric. DIE SQL-Datenbank ist die Startseite in Fabric für OLTP-Workloads und kann in die Integration der Quellcodeverwaltung von Fabric integriert werden.

Freigeben über

Was ist Spiegelung in Fabric?

Gründe für die Verwendung von Spiegelung in Fabric.

Arten der Spiegelung

Wie funktioniert die Quasi-Echtzeit-Replikation der Datenbankspiegelung?

Wie funktioniert die Metadatenspiegelung?

Wie funktioniert die offene Spiegelung?

Datenbankübergreifende Abfragen

Datentechnik mit Ihren Daten aus gespiegelten Datenbanken

Data Science mit Ihren gespiegelte Datenbankdaten

SQL-Datenbank in Fabric

Feedback

Zusätzliche Ressourcen

Freigeben über

Was ist Spiegelung in Fabric?

Gründe für die Verwendung von Spiegelung in Fabric.

Arten der Spiegelung

Wie funktioniert die Quasi-Echtzeit-Replikation der Datenbankspiegelung?

Wie funktioniert die Metadatenspiegelung?

Wie funktioniert die offene Spiegelung?

Freigabe

Datenbankübergreifende Abfragen

Datentechnik mit Ihren Daten aus gespiegelten Datenbanken

Data Science mit Ihren gespiegelte Datenbankdaten

SQL-Datenbank in Fabric

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen