Zielzone für die Datenverwaltung
Die Datenverwaltungs-Zielzone ist eine Verwaltungsfunktion, die für cloudweite Analysen zentral ist. Sie ist verantwortlich für die Governance Ihrer Analyseplattform.
Ihre Zielzone für die Datenverwaltung ist ein separates Abonnement, das die gleichen Standarddienste der Azure-Zielzone bietet. Sie ermöglicht die Datengovernance Ihrer Daten über Crawler, die eine Verbindung mit Ihren Data Lakes und polyglotten Speicher in Ihren Datenzielzonen herstellen. Virtuelles Netzwerk-Peering verbindet Ihre Datenverwaltungs-Zielzone mit Ihren Daten-Zielzonen und Konnektivitäts-Abonnements.
Diese Architektur ist ein Ausgangspunkt, und Sie können sie an Ihre spezifischen geschäftlichen und technischen Anforderungen anpassen, wenn Sie Ihre Datenverwaltungs-Landing Zone Implementierung planen.
Hinweis
Mehrsprachige Persistenz ist ein Speicherbegriff, der Ihre Wahl zwischen verschiedenen Datenspeicher-/Datenspeichertechnologien beschreibt, um Ihre verschiedenen Datentypen und ihre Speicheranforderungen zu unterstützen. Mehrsprachige Persistenz ist im Wesentlichen das Konzept, dass eine Anwendung mehr als eine Kerndatenbank oder Speichertechnologie verwenden kann.
Wichtig
Ihre Datenverwaltungszielzone muss als separates Abonnement unter einer Verwaltungsgruppe mit der entsprechenden Governance bereitgestellt werden. Anschließend können Sie die Governance in Ihrer Organisation steuern. Der Azure-Zielzonenbeschleuniger veranschaulicht, wie Sie Azure-Zielzonen angehen sollten.
Datenverwaltung
Cloud Scale Analytics schlägt die Verwendung von Microsoft Purview vor. Alternativ können Microsoft Partner-Lösungen bereitgestellt werden, um bestimmte Data-Governance-Funktionen zu verwalten. Zu den wichtigsten Funktionen, die Sie in Ihrer Architektur berücksichtigen sollten, gehören ein globaler Datenkatalog, die Stammdatenverwaltung, die Datenfreigabe und Verträge, der API-Katalog, die Datenqualitätsverwaltung und ein Datenmodellierungs-Repository.
Microsoft Partner-Data-Governance-Produkte, die eine Bereitstellung in einem Abonnement benötigen, sollten in der Data-Governance-Ressourcengruppe innerhalb der Datenverwaltungszielzone bereitgestellt werden.
Datenkatalog
Der Datenkatalog registriert und pflegt die Dateninformationen an einem zentralen Ort und macht sie für die Organisation verfügbar. Dadurch wird sichergestellt, dass Unternehmen doppelte Datenprodukte vermeiden, die durch redundante Datenerfassung durch verschiedene Projektteams verursacht werden. Es wird empfohlen, einen Datenkatalogdienst zu erstellen, um die Metadaten der Datenprodukte zu definieren, die in den Datenzielzonen gespeichert sind.
Cloud-Skalierungsanalysen sind von Microsoft Purview abhängig, um Unternehmensdatenquellen zu registrieren, sie zu klassifizieren, die Datenqualität sicherzustellen und einen sicheren Self-Service-Zugriff zu bieten.
Microsoft Purview ist ein Dienst auf Mandantenebene und kann mit jeder Datenzielzone kommunizieren, indem ein verwaltetes virtuelles Netzwerk erstellt wird, das in der Region Ihrer Datenzielzonen bereitgestellt ist. Sie können Azure Managed Virtual Network Integration Runtimes (IR) in Microsoft Purview Managed Virtual Networks in jeder verfügbaren Microsoft Purview-Region bereitstellen. Von dort aus kann die verwaltete IR des virtuellen Netzwerks private Endpunkte verwenden, um eine sichere Verbindung mit den unterstützten Datenquellen herzustellen und diese zu überprüfen. Weitere Informationen finden Sie unter Verwenden des verwalteten virtuellen Netzwerks mit Ihrem Microsoft Purview-Konto. Durch das Erstellen einer IR in einem verwaltetem virtuellen Netzwerk wird sichergestellt, dass der Datenintegrationsprozess isoliert und sicher ist.
Bei Verwendung von Azure Databricks empfehlen wir zusätzlich zu Microsoft Purview Azure Databricks Unity Catalog zu verwenden. Azure Databricks Unity Catalog bietet zentrale Zugriffssteuerung, Überwachung, Herkunftsnachverfolgung und Funktionen zur Datenerkennung in Databricks-Arbeitsbereichen. Bewährte Methoden zum Einrichten von Unity Catalog finden Sie unter Bewährte Methoden für Unity Catalog.
Hinweis
Obwohl sich diese Dokumentation in erster Linie auf die Verwendung von Microsoft Purview für die Governance konzentriert, haben Unternehmen möglicherweise in andere Produkte investiert, z. B. Alation, Okera oder Collibra. Diese Lösungen basieren auf Abonnements und wir empfehlen, sie in der Datenverwaltungszielzone bereitzustellen. Beachten Sie, dass möglicherweise organisationsspezifische Integrationsmaßnahmen erforderlich sind.
Masterdatenverwaltung
Die Masterdatenverwaltungssteuerung befindet sich in der Zielzone für die Datenverwaltung. Die Masterdatenverwaltung im Data Mesh enthält bestimmte Überlegungen, die Sie für Data Mesh aufrufen sollten.
Viele Lösungen zur Masterdatenverwaltung sind vollständig in Microsoft Entra ID integriert. Diese Integration ermöglicht es Ihnen, Ihre Daten zu schützen und unterschiedliche Ansichten für verschiedene Benutzergruppen bereitzustellen.
Weitere Informationen finden Sie unter Master Data Management System.
Datenfreigabe und Verträge
Analysen auf Cloudebene verwenden die Microsoft Entra-Berechtigungsverwaltung oder Microsoft Purview-Richtlinien, um den Zugriff auf die Datenfreigabe zu steuern. Selbst dann benötigen Sie möglicherweise noch eine Freigabe und ein Vertrags-Repository. Dieses Repository ist eine Organisationsfunktion und sollte sich in Ihrer Zielzone für die Datenverwaltung befinden.
Ihre Verträge sollten Informationen über Datenvalidierung, Modelle und Sicherheitsrichtlinien enthalten.
Weitere Informationen finden Sie unter Datenverträge.
API-Katalog
Ihre Datenanwendungsteams erstellen verschiedene APIs für ihre Datenanwendungen. Diese APIs können in anderen Teilen Ihrer Organisation schwer zu finden sein. Ein API-Katalog in Ihrer Datenverwaltungszielzone kann helfen, dieses Problem zu lösen.
Ein API-Katalog unterstützt die Standardisierung Ihrer Dokumentation und bietet einen Ort für die interne Zusammenarbeit an APIs. Er kann auch Steuermechanismen für Nutzung, Veröffentlichung und Governance in Ihrer gesamten Organisation fördern.
Datenqualitätsverwaltung
Fahren Sie mit Ihrer aktuellen Lösung fort.
Verwalten Sie die Datenqualität so nah wie möglich an der Datenquelle, um zu verhindern, dass Qualitätsprobleme auf Ihre Analyse- und KI-Systeme verteilt werden. Indem Sie Qualitätsmetriken und Validierung in Ihre Datenprozesse integrieren, richten Sie das Qualitätsmanagement an die Teams aus, die mit den Daten am vertrautsten sind, um ein tieferes Verständnis und eine bessere Handhabung der Datenressourcen sicherzustellen.
Die Datenherkunft schafft auch Vertrauen in die Datenqualität. Sie sollten sie für alle Datenprodukte bereitstellen.
Weitere Informationen zur Datenqualitätsverwaltung finden Sie unter Datenqualität.
Datenmodellierungs-Repository
Sie sollten Entitätsbeziehungsmodelle an einem zentralen Ort in Ihrer Zielzone für die Datenverwaltung erfassen und speichern, sodass Datenkunden einen einzigen Ort zum Auffinden konzeptioneller Diagramme haben.
Viele Kunden verwenden ER Studio und OrbusInfinity, um ihre Datenprodukte vor der Aufnahme zu modellieren.
Dienstebene
Ihre Organisation kann entscheiden, viele Automatisierungsdienste zu erstellen, um Cloud-Skalierungsanalysefunktionen zu erweitern. Diese Automatisierungsdienste fördern die Konformitäts- und Onboardinglösungen für Ihren Analysezustand.
Wenn Sie sich entscheiden, diese Automatisierungsdienste zu erstellen, sollten Sie über eine Benutzeroberfläche verfügen, die sowohl als Datenmarkt als auch als Betriebskonsole fungiert. Diese Schnittstelle sollte auf einem zugrunde liegenden Metadatenspeicher wie Metadatenstandards basieren.
Der Datenmarkt oder die Betriebskonsole ruft eine mittlere Ebene von Microservices auf, um das Onboarding, die Metadatenregistrierung, die Sicherheitsbereitstellung, den Datenlebenszyklus und die Sichtbarkeit zu erleichtern.
Sie können die Ressourcengruppe der Dienstebene
Wichtig
Keine dieser Automatisierungsdienste sind Produkte, und sie veranschaulichen kein Roadmap-Element. Sie werden aufgeführt, um Ihnen dabei zu helfen, welche Elemente Sie möglicherweise automatisieren möchten.
Dienst | Dienstbereich |
---|---|
Bereitstellung der Datenzielzone | Dieser Dienst erstellt eine neue Datenzielzone. Es ist unwahrscheinlich, dass es häufig verwendet wird, aber für die Vollständigkeit der End-to-End-Onboarding-Lösung ist es enthalten. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse |
Datenprodukt-Onboarding | Dieser Dienst erstellt und ändert Ressourcengruppen, die sich auf einen integrierten Mandanten beziehen. Außerdem enthält sie Funktionen zur Aktualisierung und Herabstufung von SKUs und zum Aktivieren und Deaktivieren von Ressourcengruppen für jeden angeschlossenen Mandanten oder Dienst. Es erstellt eine neue Datenzielzone DevOps. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse |
Datenagnostische Aufnahme | Dieser Microservice erstellt neue Datenquellen zur Integration in Ihre Datenzielzonen, indem er mit einem Azure Data Factory SQL-Datenbank-Metastore in jeder Datenzielzone kommuniziert. Weitere Informationen finden Sie unter Unterstützung der Analysen auf Cloudebene in Azure durch Frameworks zur automatisierten Erfassung |
Metadaten | Dieser Dienst macht Metadaten für die Plattform verfügbar und erstellt sie. Weitere Informationen finden Sie unter Metadatenstandards |
Zugriffsbereitstellung | Dieser Dienst erstellt Zugriffspakete, Zugriffsrichtlinien und Genehmigungsprozesse für den Ressourcenzugriff (manuell oder automatisch) mithilfe von SPN/UPN. Sie kann eine API auch verfügbar machen, um eine Liste der Abonnementanforderungen (Assets) bereitzustellen, die Benutzer in den letzten 90 Tagen übermittelt haben. Weitere Informationen finden Sie unter Datenzugriffsverwaltung |
Datenlebenszyklus: | Dieser Dienst ist verantwortlich für die Wartung des Datenlebenszyklus basierend auf Metadaten. Diese Wartung kann das Verschieben von Daten in den Cold Storage und das Löschen von Datensätzen umfassen, die nicht mehr aufbewahrt werden müssen. Weitere Informationen finden Sie unter Lebenszyklusverwaltung |
Onboarding von Datendomänen | GILT NUR FÜR DATA MESH. Dieser Dienst erfasst Metadaten im Zusammenhang mit neuen Domänen und integriert die neuen Domänen nach Bedarf. Er kann auch alle Domänen- oder Dienstzeilen erstellen, aktualisieren, aktivieren und deaktivieren, die Sie möglicherweise in einen Microservice erstellen. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse |
Azure Container Registry
Ihre Datenverwaltungszielzone hostet eine Azure Container Registry. Mit dem Azure Container Registry können Ihre Datenplattformvorgänge Standardcontainer für die Verwendung in Data Science-Projekten bereitstellen, die Ihre Datenanwendungsteams nutzen.