Verwalten von Daten in Microsoft Fabric
Microsoft Fabric enthält einige grundlegende Governance-Features, die möglicherweise für die Anforderungen einiger Organisationen ausreichen.
Als Gesundheitsdienstleister haben Sie genaue Anforderungen an die Data Governance, da die Gesetzgebung in einigen Ihrer Gebiete sehr streng ist, aber Sie möchten keine unnötigen Kosten verursachen. Sie möchten die Data Governance-Features in Microsoft Fabric bewerten, um herauszufinden, ob sie Ihre Anforderungen bereits abdecken.
In dieser Lektion befassen wir uns mit den Governance-Features von Fabric.
Was ist Microsoft Fabric?
Fabric ist die End-to-End-Analyse- und Datenplattform von Microsoft. Die Software-as-a-Service (SaaS)-Plattform kann Ihre Daten speichern, verschieben, verarbeiten, einlesen, umwandeln und analysieren, unabhängig von ihrer Größe und ihrem aktuellen Format. Da Fabric Ihre Daten nahtlos integriert, müssen Sie nicht mehr die Lösungen verschiedener Anbieter mit unterschiedlichen Protokollen miteinander verbinden. Sobald Sie die Daten an dem Ort und in dem Format haben, in dem Sie sie benötigen, können Sie sie mit fortschrittlichen Business-Intelligence-Features analysieren und Erkenntnisse zur Unterstützung Ihrer Entscheidungsfindung gewinnen. Alle Fabric-Features und -Tools werden durch KI-Integration unterstützt, was Ihre Produktivität beschleunigt.
Hinweis
Microsoft Fabric umfasst Features, die zuvor separat in Power BI, Azure Synapse Analytics und Azure Data Factory verfügbar waren, sowie neue Funktionen.
Fabric-Benutzeroberflächen
Fabric bietet vielfältige Oberflächen, um alle Ihre Anforderungen an die Datenbearbeitung und -analyse zu erfüllen:
- Data Factory: Nutzen Sie diese Oberfläche, um Daten aus vielen verschiedenen Quellen über diverse Datenconnectors aufzunehmen, aufzubereiten und umzuwandeln.
- Datentechnik mit Synapse: Bei dieser Oberfläche handelt es sich um eine Spark-Plattform, die Sie zum Sammeln, Speichern, Verarbeiten und Analysieren großer Datenmengen durch geplante Aufträge und Notebooks verwenden können.
- Data Warehouse mit Synapse: Nutzen Sie diese Oberfläche, um die Datenverarbeitung vom Speicher zu trennen und beide unabhängig voneinander zu skalieren. Die Daten werden im Data Lake-Format gespeichert und weisen eine branchenführende SQL-Leistung auf.
- Data Science mit Synapse: Verwenden Sie diese Oberfläche, um Machine Learning-Modelle zu trainieren, bereitzustellen und zu verwenden.
- Echtzeitintelligenz: Diese Oberfläche ist eine Komplettlösung für ereignisgesteuerte Daten, wie z. B. Gerätetelemetrie, Datenprotokolle und Streaming-Daten.
- Power BI: Nutzen Sie diese Oberfläche, um die in Ihren Daten verborgenen Trends zu visualisieren, zu untersuchen und zu entdecken. Sie können Power BI-Berichte freigeben, um die beste Entscheidungsfindung zu unterstützen.
- Data Activator: Nutzen Sie diese Oberfläche, um Aktionen wie E-Mails und Workflows festzulegen, die gestartet werden, wenn bestimmte Bedingungen in Ihren Daten erfüllt sind. Sie können diese Aktionen erstellen, ohne Code zu schreiben.
OneLake
In Fabric werden alle Informationen in einem Data Lake gespeichert, der sowohl strukturierte als auch unstrukturierte Daten enthalten kann. Die Implementierung des Data Lake von Microsoft heißt OneLake und basiert auf Azure Data Lake Storage (ADLS) Generation 2. Dieser einzelne zugrunde liegende Speichermechanismus trägt dazu bei, Silos zu beseitigen und Kosten zu senken, während gleichzeitig sichergestellt wird, dass Richtlinien und Sicherheit universell angewendet werden.
Was ist Datengovernance?
Die Daten, die Ihre Organisation besitzt und verarbeitet, sind oft geschäftskritisch und hochsensibel. Für die meisten Unternehmen ist es von entscheidender Bedeutung, dass die Daten sicher aufbewahrt werden, leicht zugänglich sind und in Übereinstimmung mit der Gesetzgebung in all den Gebieten, in denen Sie tätig sind, verarbeitet werden.
Data Governance ist ein Begriff, der die Richtlinien und Praktiken beschreibt, die Sie anwenden, um die Qualität, Konsistenz, Sicherheit und Nutzbarkeit Ihrer Daten zu gewährleisten. Die Disziplin umfasst eine Reihe von Aktivitäten und Verantwortlichkeiten, um Daten während ihres gesamten Lebenszyklus effektiv zu verwalten.
Ein Data Governance-Programm umfasst in der Regel Folgendes:
- Überwachung: Aufzeichnen, woher die Daten stammen und wer sie ändert
- Auswertung: Bewerten der Nützlichkeit und Genauigkeit Ihrer Daten
- Documentation: Beschreiben der Art Ihrer Daten für Personen, die sie verwenden könnten
- Verwaltung: Beseitigung unrichtiger Daten, Beantwortung von Auskunftsersuchen, Sicherstellung der Einhaltung von Datengesetzen
- Schutz: Schützen von Daten vor unbefugtem Zugriff, Ransomware und anderen Angriffen
Gut verwaltete Daten sind vertrauenswürdig und für die richtigen Personen leicht zugänglich.
Tipp
Große Unternehmen haben auch oft Daten, die in Silos aufgeteilt sind. Historische Systeme und Datenbanken, die sich im Besitz separater Einheiten innerhalb Ihres Unternehmens befinden, bilden aus Sicherheitsgründen Barrieren, die den Zugriff erschweren. In diesen Fällen ist die Integration von Daten und die Beseitigung von Datensilos unter Wahrung der Sicherheit eine wichtige Komponente der Data Governance.
Ein solides Data-Governance-System kann Ihrem Unternehmen folgende Vorteile bringen:
- Eine Single Source of Truth, die Verwirrung reduziert und eine gute Entscheidungsfindung unterstützt.
- Hochwertige Daten, die die Welt, die sie messen, genauer widerspiegeln.
- Schnellere Erfüllung von Zugriffsanfragen.
- Geringere Kosten für die Speicherung und Verwaltung von Daten.
Data Governance-Features in Microsoft Fabric
Sie können in Fabric viele Data-Governance-Aufgaben direkt und ohne zusätzliches Abonnement für Microsoft Purview durchführen. Sehen wir uns einige der verfügbaren Funktionen an:
Verwalten des Datenbestands
Der Datenbestand Ihrer Organisation ist die gesamte Sammlung von Datenressourcen. Große Datenstände zu pflegen und zu verwalten nimmt Verwaltungszeit in Anspruch. Fabric kann diese Aufgabe mit den folgenden Tools unterstützen:
- Im Fabric Admin-Portal steuern Sie Mandanteneinstellungen, Kapazitäten, Domänen und andere Objekte, die normalerweise Admins vorbehalten sind.
- Mandanten, Domänen und Arbeitsbereiche sind logische Container, mit denen Sie den Zugriff auf Daten und Funktionen steuern können. Fabric-Admins sollten z. B. Zugriff auf alle Einstellungen im Mandanten haben, während Datenverantwortliche auf Teamebene möglicherweise nur die Kontrolle über die Einstellungen in ihrer Domäne oder ihrem Arbeitsbereich haben.
- Domänen gruppieren Daten, die für einen einzelnen Geschäftsbereich oder ein Fachgebiet relevant sind.
- Arbeitsbereiche gruppieren Fabric-Elemente, die von einem einzelnen Team oder einer Abteilung verwendet werden.
- Funktionen: Diese Objekte beschränken den Computeressourceneinsatz für alle Fabric-Workloads.
- Metadatenüberprüfung: Beim Scannen werden Werte wie Namen, Identitäten, Empfindlichkeiten, Vermerke und so weiter aus Data Lakes extrahiert. Sie können diese Metadaten verwenden, um Governance-Richtlinien zu analysieren und festzulegen.
Sichern und Schützen von Daten
Sichere Daten sind vor unbefugtem Zugriff und destruktiven Angriffen geschützt. Außerdem ist es mit den in Ihrer Region geltenden Vorschriften zur Datenspeicherung konform. Fabric umfasst die folgenden hilfreichen Tools:
- Datentags: Verwenden Sie Tags, um die Vertraulichkeit von Daten zu identifizieren und Richtlinien für die Aufbewahrung und den Schutz von Daten anzuwenden.
- Arbeitsbereichsrollen: Verwenden Sie Rollen, um die Benutzenden zu definieren, die zum Zugriff auf die Daten in einem Arbeitsbereich berechtigt sind.
- Steuerelemente auf Datenebene: Verwenden Sie Kontrollen auf der Ebene von Fabric-Elementen wie Tabellen, Zeilen und Spalten, um granulare Beschränkungen aufzuerlegen.
- Zertifizierungen: Fabric ist mit vielen Datenverwaltungszertifizierungen konform, darunter HIPAA BAA, ISO/IEC 27017, ISO/IEC 27018, ISO/IEC 27001 und ISO/IEC 27701.
Ermutigung zur Entdeckung und Nutzung von Daten
Daten sind nur dann hilfreich, wenn die Benutzenden sie auffinden und analysieren können. Diese Features von Fabric können die Datennutzung fördern:
- OneLake-Datenhub: Mit diesem Tool können Benutzende die Daten in Ihrem Besitz leicht finden und untersuchen.
- Endorsement: Benutzende bewerten ein Fabric-Element, um es als qualitativ hochwertiges Element zu identifizieren. Endorsements helfen anderen Benutzenden, den Daten zu vertrauen, die das Element enthält.
- Datenherkunft: Dieses Feature hilft Benutzenden, den Datenfluss zwischen Elementen in einem Arbeitsbereich und die Auswirkungen einer Änderung zu verstehen.
Überwachen der Datennutzung
Mit Fabric können Benutzende überwachen, wie Informationen verwendet werden:
- Überwachungshub: Dieser Hub zeigt, was mit Fabric-Elementen passiert ist. Es werden nur Aktivitäten für die Fabric-Elemente angezeigt, die Sie anzeigen dürfen.
- Kapazitätsmetriken: Verwenden Sie die Kapazitätsmetriken-App, um die Nutzung und den Verbrauch zu überwachen.
Weitere Informationen
- Was ist Microsoft Fabric?
- Was ist Datengovernance?
- Dokumentation zur Governance von Microsoft Fabric