Einen Azure Synapse Link für Dataverse mit Azure Data Lake erstellen
Sie können den Azure Synapse Link benutzen, um Ihre Microsoft Dataverse-Daten mit Azure Data Lake Storage Gen2 zu verbinden, um verschiedene Analyseszenarien zu ermöglichen. Dieser Artikel zeigt Ihnen, wie Sie die folgenden Aufgaben ausführen:
- Ihre Dataverse-Daten mithilfe des Azure Synapse Link-Dienst mit Ihrem Azure Data Lake Storage Gen2-Konto verbinden.
- Dataverse-Tabellen verwalten, die in Azure Synapse Link enthalten sind.
- Ihren Azure Synapse Link überwachen.
- Die Verbindung Ihres Azure Synapse Link aufheben.
- Die Verbindung Ihres Azure Synapse Link wiederherstellen.
- Zeigen Sie Ihre Daten in Azure Data Lake an, und verstehen Sie die Dateistruktur.
Anmerkung
Azure Synapse Link für Dataverse war früher als „Nach Data Lake exportieren“ bekannt. Der Dienst wurde mit Wirkung zum Mai 2021 umbenannt und exportiert weiterhin Daten nach Azure Data Lake sowie Azure Synapse Analytics.
Anforderungen
- Azure Data Lake Storage Gen2: Sie brauchen ein Azure Data Lake Storage Gen2-Konto und müssen als Besitzer und Storage-Blob-Datenmitwirkender Zugriff haben. Ihr Speicherkonto muss den Hierarchischen Namespace sowohl für die Ersteinrichtung als auch für die Deltasynchronisierung aktivieren. Speicherkontoschlüsselzugriff zulassen ist nur für die Ersteinrichtung erforderlich.
Anmerkung
- Das Speicherkonto muss im selben Microsoft Entra-Mandanten wie Ihr Power Apps-Mandant erstellt werden.
- Um Von ausgewählten virtuellen Netzwerken und IP-Adressen aktiviert für verknüpfte Speicherkonten festzulegen, um Zugriff von ausgewählten IP-Adressen aus zu gewähren, müssen Sie einen Azure Synapse Link mit verwalteten Identitäten erstellen. Verwenden Sie verwaltete Identitäten für Azure mit Ihrem Azure Data Lake Storage (wenn keine verwaltete Identitäten eingerichtet sind, müssen Sie den Zugriff auf das öffentliche Netzwerk für Azure-Ressourcen sowohl für die Ersteinrichtung als auch für die Deltasynchronisierung aktivieren.)
- Wir empfehlen dringend, das Feature Vorläufiges Löschen für das für diesen Zweck ausgewählte Speicherkonto zu aktivieren. Wenn Sie das vorläufige Löschen aktivieren, können Sie versehentlich gelöschte Daten schneller wiederherstellen.
- Sie müssen den Leser-Rollenzugriff auf die Ressourcengruppe mit dem Speicherkonto haben.
- Um die Umgebung mit Azure Data Lake Storage Gen2 zu verlinken, müssen Sie die Dataverse-Systemadministrator-Sicherheitsrolle haben.
- Nur Tabellen, die die Änderungsnachverfolgung aktiviert haben, können exportiert werden.
- In einer einzigen Dataverse-Umgebung können maximal zehn Azure Synapse Link-Profile erstellt werden.
Verbinden von Dataverse mit Azure Data Lake Storage Gen2
Melden Sie sich bei Power Apps an und wählen Sie Ihre bevorzugte Umgebung aus.
Wählen Sie im linken Navigationsbereich Azure Synapse Link aus. Wenn Azure Synapse Link im Seitenbereich nicht angezeigt wird, wählen Sie ... Mehr und dann Alle entdecken aus. Azure Synapse Link befindet sich im Abschnitt Datenverwaltung.
Wählen Sie auf der Befehlsliste + Neue Verknüpfung zum Data Lake aus.
Wählen Sie das Abonnement, die Ressourcengruppe, und das Speicherkonto. Stellen Sie sicher, dass das Speicherkonto die im Abschnitt Voraussetzungen angegebenen Anforderungen erfüllt. Wählen Sie Weiter.
Anmerkung
Im Rahmen der Verlinkung der Umgebung zu einem Data Lake, gewähren Sie dem Azure Synapse Link-Dienst Zugriff auf Ihr Speicherkonto. Stellen Sie sicher, dass Sie den Voraussetzungen zum Erstellen und Konfigurieren des Azure Data Lake Storage-Kontos gefolgt sind und Ihnen selbst eine Besitzerrolle im Speicherkonto zuweisen. Zusätzlich gewähren Sie dem Power Platform-Dataflows-Service Zugriff auf Ihr Speicherkonto. Weitere Informationen: Self-Service Datenaufbereitung mit Dataflows.
Fügen Sie die Tabellen hinzu, die Sie exportieren möchten, und wählen Sie dann Speichern. Nur Tabellen mit Änderungsnachverfolgung können exportiert werden. Weitere Informationen: Änderungsverfolgung für eine Entität aktivieren.
Sie können die oben aufgeführten Schritte in diesem Artikel ausführen, um eine Verknüpfung von einer Umgebung zu mehreren Azure Data Lakes in Ihrem Azure-Abonnement zu erstellen. Auf die gleiche Weise könnten Sie einen Link aus mehreren Umgebung mit dem selben Azure Data Lake erstellen, was im selben Mandant möglich ist.
Anmerkung
Der Dienst Azure Synapse Link für Dataverse ist als sofort einsatzbereites Feature nahtlos in die Power Platform integriert. Er erfüllt die Sicherheits- und Governance-Standards für die Power Platform-Datenspeicherung und -Governance. Weitere Informationen: Datenspeicherung und Governance
Die vom Azure Synapse Link-Dienst exportierten Daten werden bei der Übertragung mit Transport Layer Security (TLS) 1.2 oder höher verschlüsselt und im Ruhezustand in Azure Data Lake Storage Gen2 verschlüsselt. Zusätzlich werden transiente Daten im Blobspeicher auch im Ruhezustand verschlüsselt. Die Verschlüsselung in Azure Data Lake Storage Gen2 hilft Ihnen beim Schutz Ihrer Daten, bei der Implementierung von Sicherheitsrichtlinien des Unternehmens und bei der Erfüllung gesetzlicher Vorschriften. Weitere Informationen: Azure Datenverschlüsselung im Ruhezustand
Tabellendaten für den Data Lake verwalten
Nachdem Sie Azure Synapse Link eingerichtet haben, können Sie die exportierten Tabellen auf zwei Arten verwalten:
Wählen Sie im Power Apps Maker Portal im Bereich Azure Synapse Link in der Befehlsleiste Tabellen verwalten aus, um eine oder mehrere verknüpfte Tabellen hinzuzufügen oder zu entfernen.
Wählen Sie im Bereich Tabellen des Power Apps Maker Portals ... neben einer Tabelle und dann den verknüpften Data Lake aus, in den Sie Tabellendaten exportieren möchten.
Ihren Azure Synapse Link überwachen
Nachdem Sie Azure Synapse Link eingerichtet haben, können Sie Azure Synapse Link in der Registerkarte Tabellen überwachen.
- Es wird eine Liste von Tabellen angezeigt, die zum ausgewählten Azure Synapse Link gehören.
- Es gibt verschiedene Stufen, durch die der Synchronisierungsstatus zirkuliert. NotStarted zeigt an, dass die Tabelle darauf wartet, synchronisiert zu werden. Sobald die anfängliche Synchronisierung der Tabelle Abgeschlossen ist, gibt es eine Nachbearbeitungsphase, in der keine inkrementellen Aktualisierungen stattfinden. Dies kann je nach Größe Ihrer Daten einige Stunden dauern. Wenn die inkrementellen Updates beginnen, wird das Datum für die letzte Synchronisierung regelmäßig aktualisiert.
- Die Spalte Count zeigt die Anzahl der geschriebenen Zeilen an. Wenn Nur anhängen auf Nein festgelegt ist, ist dies die Gesamtzahl der Datensätze. Wenn Nur anhängen auf Ja festgelegt ist, ist dies die Gesamtzahl der Änderungen.
- Die Nur anhängen- und Partitionsstrategie-Spalten zeigen die Verwendung unterschiedlicher erweiterter Konfigurationen.
Eine Azure Synapse Link-Verknüpfung aufheben
Wählen Sie den gewünschten Azure Synapse Link aus, um die Verknüpfung aufzuheben.
Wählen Sie Verknüpfung zum Data Lake aufheben aus der Befehlsleiste.
Um das Data Lake-Dateisystem zu löschen, wählen Sie Data Lake-Dateisystem löschen.
Wählen Sie Ja und warten Sie einige Minuten, bis alle Verknüpfungen aufgehoben und gelöscht wurden.
Eine Azure Synapse Link-Verknüpfung wiederherstellen
Wenn Sie das Dateisystem beim Aufheben der Verknüpfung gelöscht haben, führen Sie die obigen Schritte aus, um denselben Data Lake erneut zu verknüpfen. Wenn Sie das Dateisystem beim Aufheben der Verknüpfung nicht gelöscht haben, müssen Sie die Daten für die erneute Verknüpfung löschen:
Wechseln Sie zum Azure Data Lake.
Löschen Sie den Dataverse-Container.
Wechseln Sie zu Power Apps und verknüpfen Sie den Data Lake erneut.
Anzeigen Ihrer Daten in Azure Data Lake Storage Gen2
Wählen Sie den gewünschten Azure Synapse Link und dann Zum Azure Data Lake wechseln im oberen Bereich aus.
Erweitern Sie Dateisysteme, und wählen Sie dann Dataverse-Umgebungsname-OrganisationUniqueName aus.
Die Datei model.json enthält neben ihrem Namen und ihrer Version eine Liste der Tabellen, die in den Data Lake exportiert wurden. Die Datei model.json enthält auch den anfänglichen Synchronisationsstatus und die Zeit der Fertigstellung der Synchronisierung.
Für jede in den Data Lake exportierte Tabelle wird ein Ordner angezeigt, der durch Trennzeichen getrennte Snapshot-Dateien (CSV-Format) enthält.
Einen Synapse-Arbeitsbereich mit einem vorhandenen Azure Synapse Link-Profil nur mit Data Lake verknüpfen
Fügen Sie in der Adressleiste des Webbrowsers
?athena.updateLake=true
an die Webadresse an, die mit exporttodatalake endet.Wählen Sie ein vorhandenes Profil aus dem Azure Synapse Link-Bereich und dann die erweiterte Option aus.
Wählen Sie Mit Azure Synapse Analytics-Arbeitsbereich verknüpfen aus und warten Sie einige Minuten, bis alle Verknüpfungen erstellt wurden.
Kontinuierliche Snapshot-Updates
Microsoft Dataverse Daten können sich kontinuierlich durch das Erstellen, Aktualisieren und Löschen von Transaktionen ändern. Snapshots stellen eine schreibgeschützte Kopie der Daten dar, die in regelmäßigen Abständen, in diesem Fall stündlich, aktualisiert wird. Dies stellt sicher, dass ein Datenanalyse-Konsument zu jedem Zeitpunkt zuverlässig Daten im Lake konsumieren kann.
Wenn Tabellen beim ersten Export hinzugefügt werden, werden die Tabellendaten in die table.csv-Dateien unter den entsprechenden Ordnern in den Data Lake geschrieben. Dies ist das T1-Intervall, in dem eine schreibgeschützte Momentaufnahmendatei namens Tabelle-T1.csv – zum Beispiel Account-T1.csv oder Contacts-T1.cs – verstellt wird. Darüber hinaus wird die model.json-Datei aktualisiert, um auf diese Momentaufnahme-Dateien zu verweisen. Wenn Sie model.json öffnen, können Sie die Details des Snapshots anzeigen.
Hier ist ein Beispiel für eine in Account.csv partitionierte Datei und einen Snapshot-Ordner im Data Lake.
Änderungen in Dataverse werden kontinuierlich mit Hilfe der Trickle-Feed-Engine in die entsprechenden CSV-Dateien übertragen. Dies ist das T2-Intervall, in dem eine weitere Momentaufnahme erstellt wird. Tabelle-T2.csv – zum Beispiel Accounts-T2.csv oder Contacts-T2.csv (vorausgesetzt, es gibt Änderungen für die Tabelle) – und model.json werden auf die neuen Momentaufnahmendateien aktualisiert. Jede neue Person, die die Snapshot-Daten ab T2 anzeigt, wird zu den neueren Snapshot-Dateien geleitet. Auf diese Weise kann der ursprüngliche Snapshot-Viewer weiterhin an den älteren Snapshot-T1-Dateien arbeiten, während neuere Viewer die neuesten Aktualisierungen lesen können. Dies ist in Szenarien mit länger laufenden Downstream-Prozessen nützlich.
Anmerkung
Eine neue Momentaufnahmedatei wird nur erstellt, wenn eine Datenaktualisierung erfolgt. Nur die letzten fünf Snapshot-Dateien werden beibehalten. Stagnierende Daten werden automatisch aus Ihrem Azure Data Lake Storage Gen 2-Konto entfernt.
Hier ist ein Beispiel für die Datei model.json, die immer auf die letzte zeitgestempelte Konto-Snapshot-Datei verweist.
Was kommt als Nächstes?
Entdecken Sie, wie Sie nach erfolgreicher Verwendung des Dienstes Azure Synapse Link für Dataverse Ihre Daten in der Discover-Hub analysieren und nutzen können. Um auf die Discover-Hub zuzugreifen, gehen Sie zu Power Apps>Azure Synapse Link. Wählen Sie Ihren verknüpften Dienst aus, und wählen Sie dann die Registerkarte Hub entdecken aus. Hier finden Sie empfohlene Tools und kuratierte Dokumentationen, mit denen Sie Ihre Daten optimal nutzen können.
Siehe auch
Dataverse-Daten im Data Lake mit Power BI analysieren
Dataverse-Daten im Data Lake mit Azure Data Factory erfassen
Erweiterte Konfiguration für Azure Synapse Link für Dataverse