Klonen einer Tabelle in Microsoft Fabric
Gilt für:✅ Warehouse in Microsoft Fabric
Microsoft Fabric bietet die Möglichkeit, nahezu sofortige Zero-Copy-Klone mit minimalen Speicherkosten zu erstellen.
- Geklonte Tabellen unterstützen Entwicklungs- und Testprozesse durch das Erstellen von Tabellenkopien in niedrigeren Umgebungen.
- Geklonte Tabellen bieten eine konsistente Berichterstellung und Zero-Copy-Duplizierung von Daten für analytische Workloads und für Machine Learning-Modellierung und -Tests.
- Geklonte Tabellen ermöglichen die Datenwiederherstellung im Falle eines fehlerhaften Release oder einer Datenbeschädigung, indem der vorherige Status der Daten beibehalten wird.
- Geklonte Tabellen unterstützen bei der Erstellung von Verlaufsberichten, die den Status der Daten zu einem bestimmten Zeitpunkt in der Vergangenheit widerspiegeln.
- Tabellenklonen zu einem bestimmten Zeitpunkt können den Status der Daten zu bestimmten Geschäftszeiten beibehalten.
Sie können die T-SQL-Befehle CREATE TABLE AS CLONE OF verwenden, um eine geklonte Tabelle zu erstellen. Ein Tutorial finden Sie unter Tutorial: Klonen einer Tabelle mit T-SQL oder Tutorial: Klonen von Tabellen im Fabric-Portal.
Sie können die Daten in einem Warehouse auch so abfragen, wie sie in der Vergangenheit erschienen sind, indem Sie die T-SQL OPTION
-Syntax verwenden. Weitere Informationen finden Sie unter Daten abfragen, wie sie in der Vergangenheit vorhanden waren.
Was ist ein Zero-Copy-Klon?
Ein Zero-Copy-Klon erstellt ein Replikat der Tabelle, indem er die Metadaten kopiert, während er weiterhin auf dieselben Datendateien in OneLake verweist. Die Metadaten werden kopiert, wohingegen die zugrunde liegenden Daten der Tabelle, die als Parquet-Dateien gespeichert sind, nicht kopiert werden. Die Erstellung eines Klons ähnelt dem Erstellen einer Tabelle in einem Warehouse in Microsoft Fabric.
Tabellenklon in Fabric Data Warehouse
In einem Warehouse kann der Klon einer Tabelle nahezu sofort mithilfe von einfachem T-SQL erstellt werden. Der Klon einer Tabelle kann innerhalb eines Warehouse oder schemaübergreifend in einem Warehouse erstellt werden.
Erstellen eines Tabellenklons
Der Klon einer Tabelle kann basierend auf einem der folgenden Zeitpunkte erstellt werden:
Aktueller Zeitpunkt: Der Klon basiert auf dem aktuellen Status der Tabelle.
Vorheriger Zeitpunkt: Der Klon basiert auf einem Zeitpunkt, der bis zu dreißig Tage in der Vergangenheit liegt. Die geklonte Tabelle enthält die Daten in dem Status, der zum gewünschten Zeitpunkt in der Vergangenheit vorlag. In der Branche wird dieses Feature als Ortswechsel in der angegebenen Zeit bezeichnet. Die neue Tabelle wird mit einem Zeitstempel erstellt, der auf UTC basiert. Beispiele finden Sie unter Klonen der Tabelle mit dem Status zu einem Zeitpunkt in der Vergangenheit oder CREATE TABLE AS CLONE OF.
Sie können auch eine Gruppe von Tabellen gleichzeitig klonen. Dies kann nützlich sein, um eine Gruppe verwandter Tabellen zu demselben Zeitpunkt zu klonen. Ein Beispiel finden Sie unter Gleichzeitiges Klonen mehrerer Tabellen.
Sie können auch Daten aus Tabellen abfragen, wie sie in der Vergangenheit existierten, indem Sie die Funktion Ortswechsel in der angegebenen Zeit im Warehouse verwenden.
Beibehaltung von Daten
Warehouse behält den Datenverlauf automatisch für dreißig Kalendertage bei, so dass Klone zu einem bestimmten Zeitpunkt erstellt werden können. Alle am Data Warehouse vorgenommenen Änderungen (Einfügen, Aktualisieren, Löschen) werden für dreißig Kalendertage aufbewahrt.
Es gibt keine Beschränkung für die Anzahl von Klonen, die innerhalb von Schemas und schemaübergreifend erstellt werden.
Separat und unabhängig
Beim Erstellen einer geklonten Tabelle ist diese eine unabhängige und separate Kopie der Datenquelle.
- Alle Änderungen, die über DML oder DDL an der Quelle der geklonten Tabelle vorgenommen wurden, werden in der geklonten Tabelle nicht widergespiegelt.
- Ebenso werden alle Änderungen, die über DDL oder DML an der geklonten Tabelle vorgenommen wurden, nicht in der Quelle der geklonten Tabelle widergespiegelt.
Berechtigungen zum Erstellen einer geklonten Tabelle
Zum Erstellen einer geklonten Tabelle sind die folgenden Berechtigungen erforderlich:
- Benutzer*innen mit den Arbeitsbereichsrollen „Administrator“, „Mitglied“ oder „Mitwirkender“ können die Tabellen innerhalb des Arbeitsbereichs klonen. Die Arbeitsbereichsrolle „Anzeigender Benutzer“ kann keinen Klon erstellen.
- Die SELECT-Berechtigung für alle Zeilen und Spalten der Quelle der geklonten Tabelle ist hierfür erforderlich.
- Benutzer*innen müssen über die CREATE TABLE-Berechtigung in dem Schema verfügen, in dem die geklonte Tabelle erstellt wird.
Löschen einer geklonten Tabelle
Aufgrund ihrer autonomen Existenz können die ursprüngliche Quelle und die Klone ohne Einschränkungen gelöscht werden. Sobald ein Klon erstellt wurde, bleibt er bestehen, bis er durch den oder die Benutzer*in gelöscht wird.
- Benutzer*innen mit den Arbeitsbereichsrollen „Administrator“, „Mitglied“ oder „Mitwirkender“ können die geklonten Tabellen innerhalb des Arbeitsbereichs löschen.
- Benutzer*innen mit ALTER SCHEMA-Berechtigungen für das Schema, in dem sich die geklonte Tabelle befindet, können die geklonte Tabelle löschen.
Vererbung bei geklonten Tabellen
Die hier beschriebenen Objekte sind in der geklonten Tabelle enthalten:
Die geklonte Tabelle erbt SQL-Sicherheit auf Objektebene aus der Quelltabelle des Klons. Da die Arbeitsbereichsrollen standardmäßig Lesezugriff bieten, kann bei Bedarf die DENY-Berechtigung für die geklonte Tabelle festgelegt werden.
Die geklonte Tabelle erbt die Sicherheit auf Zeilenebene (RLS) und die dynamische Datenmaskierung von der Quelle der geklonten Tabelle.
Die geklonte Tabelle erbt alle in der Quelltabelle vorhandenen Attribute, unabhängig davon, ob der Klon innerhalb desselben Schemas oder schemaübergreifend in einem Warehouse erstellt wurde.
Die geklonte Tabelle erbt die in der Quelldatei definierten Einschränkungen für primäre und eindeutige Schlüssel.
Für jede geklonte Tabelle, die innerhalb des Warehouse erstellt wird, wird ein schreibgeschütztes Deltaprotokoll erstellt. Die als Parquet-Deltadateien gespeicherten Datendateien sind schreibgeschützt. Dadurch wird sichergestellt, dass die Daten immer vor Beschädigungen geschützt bleiben.
Tabellenklonszenarios
Berücksichtigen Sie die Möglichkeit, Tabellen nahezu sofort und mit minimalen Speicherkosten in den folgenden vorteilhaften Szenarios zu klonen:
Entwickeln und Testen
Geklonte Tabellen ermöglichen es Entwicklern und Testern, mit den Tabellen zu experimentieren sowie sie zu überprüfen und zu verfeinern, ohne dabei die Tabellen in der Produktionsumgebung zu beeinträchtigen. Der Klon bietet einen sicheren und isolierten Raum für die Durchführung von Entwicklungs- und Testaktivitäten neuer Features, um die Integrität und Stabilität der Produktionsumgebung zu gewährleisten. Verwenden Sie eine geklonte Tabelle, um schnell eine Kopie der produktionsähnlichen Umgebung für die Problembehandlung, für Experimente, für die Entwicklung und zu Testzwecken zu starten.
Konsistente Berichterstellung, Datenuntersuchung und Machine Learning-Modellierung
Um mit der sich ständig wandelnden Datenlandschaft Schritt zu halten, ist die häufige Ausführung von ETL-Aufträgen (Extrahieren, Transformieren und Laden) unerlässlich. Geklonte Tabellen helfen Ihnen dabei, dieses Ziel zu erreichen, indem sie die Datenintegrität sicherstellen und gleichzeitig die Flexibilität bieten, Berichte basierend auf den geklonten Tabellen während der laufenden Hintergrundverarbeitung zu generieren. Darüber hinaus ermöglichen geklonte Tabellen die Reproduzierbarkeit früherer Ergebnisse für Machine Learning-Modelle. Sie ermöglichen auch wertvolle Erkenntnisse, indem sie die Untersuchung und Analyse von Verlaufsdaten ermöglichen.
Kostengünstige, nahezu sofortige Wiederherstellung
Im Falle eines versehentlichen Datenverlusts oder einer Datenbeschädigung können vorhandene geklonte Tabellen genutzt werden, um die Tabelle in ihrem vorherigen Status wiederherzustellen.
Datenarchivierung
Für Überwachungs- oder Compliancezwecke können Zero-Copy-Klone problemlos verwendet werden, um Kopien von Daten in dem Status zu erstellen, der zu einem bestimmten Zeitpunkt in der Vergangenheit vorlag. Einige Daten müssen möglicherweise zur Langzeitaufbewahrung oder Einhaltung gesetzlicher Fristen archiviert werden. Durch das Klonen der Tabelle zu verschiedenen Zeitpunkten in der Vergangenheit wird sichergestellt, dass Daten in ihrer ursprünglichen Form erhalten bleiben.
Begrenzungen
- Geklonte Tabellen zwischen Warehouses in einem Arbeitsbereich werden derzeit nicht unterstützt.
- Geklonte Tabellen zwischen Arbeitsbereichen werden derzeit nicht unterstützt.
- Die Klonen von Tabellen wird für den SQL-Analyseendpunkt des Lakehouse nicht unterstützt.
- Das Klonen eines Warehouse oder Schemas wird derzeit nicht unterstützt.
- Geklonte Tabellen, die vor dem Aufbewahrungszeitraum von dreißig Tagen übermittelt wurden, können nicht erstellt werden.
- Änderungen am Tabellenschema verhindern, dass ein Klon vor der Tabellenschemaänderung erstellt wird.