Anforderungen für die Datengovernance
Für Analysen auf Cloudebene wird empfohlen, die folgenden Anforderungen für die Datengovernance zu berücksichtigen:
- Definition von Datenentitäten in einem Unternehmensglossar, um ein einheitliches Geschäftsvokabular zu schaffen. Datenentitäten beziehen sich in diesem Zusammenhang auf Konzepte wie Kunde, Lieferant, Materialien, Mitarbeiter und Ähnliches.
- Identifikation und Ermittlung von Datenentitäten.
- Datenklassifizierung zum Steuern der Datenzugriffssicherheit, des Datenschutzes und der Datenaufbewahrung.
- Für Datenschutz und -qualität verantwortliche Personen wie Datenbesitzer mit Governance-Verantwortlichkeit und Data Stewards
- Datengovernanceprozesse
- Verwaltung des Datenlebenszyklus zum Steuern der Aufbewahrungsdauer von Daten.
- Richtlinien und Regeln zum Definieren der Governance für spezifische Datentypen während des gesamten Lebenszyklus
- Durchsetzung von Richtlinien in allen Datenspeichern der verteilten Datenlandschaft
- Masterdatenverwaltung, um die Daten über Betriebs- und Analysesysteme hinweg konsistent zu machen (z. B. Kunde, Produkt und Lieferant).
- Metadatenherkunft zum Nachvollziehen der Transformation und Beziehung von Datenentitäten.
- Eine Technologie für die Governance strukturierter, multistrukturierter und unstrukturierter Daten. Die Governance kann das Rechenzentrum, mehrere Clouds und den Edge abdecken.
Eine Herausforderung besteht darin, dass Daten an mehreren Stellen im gesamten Unternehmen gesammelt und gespeichert werden. Darunter können sich Daten befinden, die in unterschiedlichen geografischen Regionen mit unterschiedlicher Gesetzgebung gesammelt und gespeichert werden. Für die Governance derselben Daten können daher je nach Rechtssystem unterschiedliche Gesetze gelten. Die Auffindbarkeit und Nutzung von Daten, die auf mehrere Clouds und geografische Standorte verteilt sind, ermöglicht Ihnen Folgendes:
- Verstehen, welche Datenattribute, Datenentitäten und Datenbeziehungen in der verteilten Datenlandschaft vorhanden sind
- Klassifizieren der Daten zum Erarbeiten geeigneter Governancemethoden
- Definieren von Richtlinien, die für jeden Datenklassifizierungstyp und die Lebenszyklusverwaltung festlegen, wie Daten gesteuert werden sollen
- Durchsetzen von Richtlinien für Datenqualität, Datenzugriffssicherheit, Datenschutz und Lebenszyklusverwaltung in der gesamten verteilten Datenlandschaft
Datenklassifizierung
Die Datenklassifizierung ist eine Möglichkeit, Datenressourcen durch Zuweisung eindeutiger logischer Tags oder Klassen zu kategorisieren. Die Klassifizierung basiert auf dem Aufgabenkontext der Daten.
Daten müssen klassifiziert werden, um Sie gemäß ihres Vertraulichkeitsgrads und ihrer Beibehaltungsdauer einzuordnen. Für die Klassifizierung ist Folgendes erforderlich:
- Ein Klassifizierungsschema für die Vertraulichkeit von Daten
- Ein Klassifizierungsschema für die Beibehaltungsdauer von Daten
Klassifizierungsschema für die Datenvertraulichkeit
Klassifizierung | Beschreibung |
---|---|
Öffentlich | Jeder kann auf die Daten zugreifen, und die Daten können an jeden gesendet werden (z. B. offene Verwaltungsdaten). |
Nur interne Verwendung. | Nur Mitarbeiter können auf die Daten zugreifen, und die Daten können nicht an Empfänger außerhalb des Unternehmens gesendet werden. |
Vertraulich | Die Daten können nur geteilt werden, wenn sie für einen bestimmten Vorgang erforderlich sind. Ohne Geheimhaltungsvereinbarung können die Daten nicht an Empfänger außerhalb des Unternehmens gesendet werden. |
Vertraulich (personenbezogene Daten) | Die Daten enthalten private Informationen, die maskiert und nur nach dem Need-to-know-Prinzip für eine begrenzte Zeit geteilt werden dürfen. Die Daten können nicht an nicht autorisierte Mitarbeiter oder an Personen außerhalb des Unternehmens gesendet werden. |
Eingeschränkt | Die Daten können nur mit benannten Personen geteilt werden, die für den Schutz der Daten verantwortlich sind (z. B. juristische Dokumente oder Geschäftsgeheimnisse). |
Klassifizierungsschema für die Aufbewahrungsdauer im Datenlebenszyklus
Aufbewahrung | BESCHREIBUNG |
---|---|
Keine | Daten können jederzeit gelöscht werden. |
Temporäre Prozeduren | Daten werden für einen kurzen Zeitraum aufbewahrt (z. B. Aufbewahrung von Twitter-Daten für eine Woche). |
Fester Zeitraum | Daten werden für eine festgelegte Anzahl von Jahren aufbewahrt und können dann gelöscht werden (z. B. Aufbewahrung von Steuerunterlagen für sieben Jahre, um die gesetzlichen Bestimmungen einzuhalten). |
Dauerhaft | Daten werden nie gelöscht (z. B. juristischer Schriftverkehr). |
Um Daten innerhalb der gesamten verteilten Datenlandschaft einheitliche Bezeichnungen zuweisen zu können, muss der Prozess zur Klassifizierung von Daten nach Vertraulichkeit und Aufbewahrungsdauer im Datenlebenszyklus mithilfe der in den einzelnen Schemas definierten Klassen automatisiert werden. Die Automatisierung ermöglicht eine einheitliche und korrekte Governance. Definieren Sie dann im Klassifizierungsschema Regeln und Richtlinien für jede Klasse, um festzulegen, welche Governance für Daten basierend auf ihrer Klassifizierung erfolgen soll.
Rollen und Zuständigkeiten bei der Datengovernance
Weiterhin müssen Verantwortlichkeiten definiert werden. Andernfalls ist nicht klar, wer für die Datengovernance zuständig ist. Es muss klare Verantwortlichkeiten geben, um etwa folgende Fragen zu beantworten:
- Wer legt Erfolgsmetriken fest und überwacht, wie gut das Datengovernanceprogramm funktioniert?
- Wer sind die Datenbesitzer?
- Wer definiert und verwaltet ein Unternehmensglossar?
- Wer erstellt und verwaltet Richtlinien für die Zugriffssicherheit?
- Wer ist für den Schutz personenbezogener Daten aus Compliancegründen verantwortlich?
- Wer kümmert sich um die Qualität der Produktdaten in allen Katalogen und Partnerwebsites?
- Wer stellt sicher, dass Kundendaten in allen Systemen übereinstimmen?
- Wer kontrolliert, dass die externe Nutzung von Abonnementdaten lizenzgerecht erfolgt?
- Wer kontrolliert privilegierte Benutzer wie Datenbankadministratoren und Data Scientists?
- Ein Mitglied des Vorstands? Ein Abteilungsleiter?
- Der Leiter von Governance, Risiko und Compliance?
- Wie sieht es mit der Rechtsabteilung aus?
- Ist die IT dafür verantwortlich?
Rollen und Zuständigkeiten sind erforderlich, um Verwirrung zu vermeiden und die Grundlage für eine Datenkultur zu schaffen.
Datengovernanceprozesse
Neben Rollen und Zuständigkeiten sind Prozesse für Folgendes erforderlich:
- Governance der Erstellung und Pflege eines allgemeinen Geschäftsvokabulars
- Ermitteln und Identifizieren, welche Daten vorhanden sind, was sie bedeuten und wo sie gespeichert sind
- Klassifizieren von Daten zum Erarbeiten geeigneter Governancemethoden
- Governance des Definierens und Pflegens von Sicherheitsrichtlinien für den Datenzugriff
- Governance des Definierens und Pflegens von Datenschutzrichtlinien
- Erkennen und Beheben von Problemen mit der Datenqualität
- Anwenden von Richtlinien, die sicherstellen, dass Maßnahmen für die Konformität ergriffen werden
- Governance der Pflege von Masterdaten
Richtlinien und Regeln für die Datengovernance
Definieren sie folgende Richtlinien und Regeln:
- Datenintegritätsregeln
- Datenerfassungsrichtlinien und -regeln
- Sicherheitsrichtlinien und -regeln für den Datenzugriff
- Datenschutzrichtlinien und -regeln
- Datenqualitätsrichtlinien und -regeln
- Richtlinien und Regeln für die Datenpflege
- Richtlinien und Regeln für die Beibehaltung von Daten
Ordnen Sie diese Richtlinien und Regeln jeder Klasse in den Datengovernance-Klassifizierungsschemas zu.
Masterdatenverwaltung
Eine weitere Anforderung bei der Datengovernance ist die Masterdatenverwaltung. Masterdaten sind die am häufigsten genutzten Daten in allen Organisationen und umfassen grundlegende Datenentitäten. Zu den wichtigsten Datenentitäten gehören Kunden, Lieferanten, Materialien, Mitarbeiter und Ressourcen. Sie enthalten auch ein Finanzdiagramm mit Kontendaten verschiedener Finanzanwendungen. Da Masterdaten so weit verbreitet sind, sind Sie nicht von bestimmten Anwendungen abhängig. Sie werden sowohl von Anwendungen für die Verarbeitung operativer Transaktionen als auch von Analysesystemen benötigt. Um Datenfehler und Verarbeitungsfehler zu verhindern, müssen diese Daten stets synchronisiert sein. Daher werden sie idealerweise zentral durch einen gemeinsamen Prozess verwaltet und jedes System, das sie benötigt, synchronisiert. Außerdem ist Governance erforderlich, um zu festzulegen, wer sie verwalten darf und wo diese Wartung erfolgen muss.
Dasselbe gilt für Verweisdaten wie Codesätze und Finanzmarktdaten. In diesem Fall wird die Standardisierung und Synchronisierung von Codesätzen als Verweisdatenverwaltung bezeichnet. Diese ist ebenfalls eine Notwendigkeit.
Metadatenherkunft
Schließlich besteht die Notwendigkeit zum Nachverfolgen der Metadatenherkunft. Sie können einen Überwachungspfad verwenden, um zu wissen, woher Daten stammen und wie sie auf dem Weg zu einem Bericht oder Datenspeicher transformiert werden. Sie können Metadaten verwenden, um nachzuverfolgen, wer oder was Daten verwaltet, sowie wann und wo dies geschieht.
Zusammenfassung der Erfordernisse für umfassende Datengovernance
Sie benötigen eine End-to-End-Lösung für die Governance von Daten während ihres gesamten Lebenszyklus – in Datenspeichern im Edgebereich, in mehreren Clouds und im Rechenzentrum.
Ihre Datengovernancelösung sollte mehrere Komponenten aufweisen:
- Eine Vision und Strategie für die Datengovernance
- Die Daten selbst, z. B. Kundendaten, Lieferantendaten, Bestelldaten und andere
- Der Datenlebenszyklus von der Erstellung bis zur Zerstörung, in dem die Governance der Daten erfolgt
- Rollen und Zuständigkeiten bei der Datengovernance (Personen)
- Datengovernanceprozesse und -aktivitäten und deren Anwendung auf den Datenlebenszyklus
- Richtlinien und Regeln für die Steuerung von Daten an verschiedenen Punkten im Lebenszyklus
- Datengovernancetechnologien, die die Datengovernance ermöglichen