Beschreiben der Datenklassifizierungsfunktionen von Microsoft Purview Information Protection

Abgeschlossen

Organisationen müssen ihre Daten kennen, um alle wichtigen Informationen zu identifizieren und sicherzustellen, dass die Daten gemäß den Konformitätsanforderungen verarbeitet werden. Administratoren können es ihrer Organisation ermöglichen, ihre Daten durch Datenklassifizierung und Explorer-Funktionen zu kennen, die im Microsoft Purview-Portal verfügbar sind.

Typen vertraulicher Informationen

Typen vertraulicher Informationen (Sensitive Information Types, SIT) sind musterbasierte Klassifizierer. Sie weisen festgelegte Muster auf, die zur Identifizierung verwendet werden können. Beispielsweise kann eine Identifikationsnummer in einem Land bzw. einer Region auf einem bestimmten Muster basieren. Beispiel:

123-456-789-ABC

Microsoft Purview enthält viele integrierte Typen vertraulicher Informationen auf Grundlage von Mustern, die durch einen regulären Ausdruck (Regular Expression, RegEx) oder eine Funktion definiert werden.

Beispiele:

  • Kreditkartennummer
  • Pass- oder Identifikationsnummern
  • Kontonummern
  • Krankenversichertennummern

Eine Liste der verfügbaren integrierten Typen vertraulicher Informationen finden Sie in den Entitätsdefinitionen für vertrauliche Informationstypen.

Die Datenklassifizierung in Microsoft Purview unterstützt auch das Erstellen von benutzerdefinierten Typen vertraulicher Informationen, um organisationsspezifische Anforderungen zu erfüllen. Beispielsweise muss eine Organisation möglicherweise Typen vertraulicher Informationen erstellen, um Mitarbeiter-IDs oder Projektnummern darzustellen.

Darüber hinaus wird die Klassifizierung der exakten Datenübereinstimmung (Exact Data Match, EDM) unterstützt. Mit der EDM-basierten Klassifizierung können Sie benutzerdefinierte Typen vertraulicher Informationen erstellen, die sich auf genaue Werte in einer Datenbank mit vertraulichen Informationen beziehen. Im Microsoft Purview-Portal werden Typen vertraulicher Informationen als EDM-Klassifiziererbezeichnet.

Typen vertraulicher Informationen können mit Vertraulichkeitsbezeichnungen, Aufbewahrungsbezeichnungen und in vielen Microsoft Purview- und Microsoft Priva-Lösungen verwendet werden.

Trainierbare Klassifizierer

Trainierbare Klassifizierer verwenden künstliche Intelligenz (KI) und maschinelles Lernen, um Ihre Daten intelligent zu klassifizieren. Sie eignen sich besonders für die Klassifizierung von Daten, die für eine Organisation spezifisch sind (z. B. bestimmte Vertragsarten, Rechnungen oder Kundendatensätze). Diese Klassifizierungsmethode dient eher dazu, einen Klassifizierer für das Erkennen eines Elements basierend auf dessen Art und nicht auf den darin enthaltenen Elementen zu trainieren (Musterabgleich). Diese beiden Typen von Klassifizierern sind verfügbar:

  • Vorab trainierte Klassifizierer: Microsoft hat viele vorab trainierte Klassifizierer erstellt, die Sie verwenden können, ohne sie trainieren zu müssen. Diese Klassifizierer weisen den Status Einsatzbereit auf. Microsoft Purview umfasst fünf vorab trainierte Klassifizierer, die beispielsweise personenbezogene Daten, Quellcode, Schikane, Obszönitäten und Drohungen (von Gewaltanwendung oder Körperverletzung) erkennen und klassifizieren können.

  • Benutzerdefinierte trainierbare Klassifizierer: Microsoft unterstützt die Option zum Erstellen und Trainieren benutzerdefinierter Klassifizierer. Sie eignen sich besonders für die Klassifizierung von Daten, die für eine Organisation spezifisch sind (z. B. bestimmte Vertragsarten, Rechnungen oder Kundendatensätze).

Damit ein benutzerdefinierter, trainierbarer Klassifizierer ein Element exakt in eine bestimmte Inhaltskategorie einordnen kann, muss er zunächst mit einer Vielzahl von Beispielen für den Inhaltstyp in dieser Kategorie trainiert werden. Dieses Feeding mit positiven Beispielen wird auch als Seeding bezeichnet und dient zum Erstellen eines Vorhersagemodells für den Klassifizierer.

Das Modell wird getestet, um zu bestimmen, ob der Klassifizierer ordnungsgemäß zwischen Elementen unterscheiden kann, die entweder dieselbe oder eine andere Kategorie aufweisen. Das Ergebnis jeder Vorhersage wird manuell überprüft, was als Eingabe dient, um die Genauigkeit des Vorhersagemodells zu verbessern.

Wenn sich der Genauigkeitsscore des Modells stabilisiert hat, kann der Klassifizierer veröffentlicht werden. Trainierbare Klassifizierer können dann beispielsweise Elemente in Speicherorten wie SharePoint Online, Exchange und OneDrive sortieren und den Inhalt klassifizieren.

Hinweis

Derzeit funktionieren Klassifizierer nur mit Elementen, die nicht verschlüsselt sind.

Daten verstehen und untersuchen

Die Datenklassifizierung kann eine große Anzahl von Dokumenten und E-Mails umfassen. Um Administratoren dabei zu helfen, Einblicke und Verständnis zu gewinnen, bietet der Knoten „Explorers“ unter „Information Protection“ im Microsoft Purview-Portal Tools wie z. B. den Aktivitätsexplorer und den Inhaltsexplorer, die Details auf einen Blick bereitstellen, einschließlich:

  • Anzahl der Elemente, die als vertrauliche Informationen klassifiziert wurden und wie diese Klassifizierungen lauten
  • Details zu den Speicherorten der Daten basierend auf der Vertraulichkeit
  • Zusammenfassung aller Aktionen, die Benutzer in der gesamten Organisation im Zusammenhang mit vertraulichem Inhalt durchführen

Administratoren können die von diesen Tools gewonnenen Informationen auch verwenden, um ihre Aktionen zu steuern.

  • Inhaltsexplorer: Der Inhaltsexplorer stellt eine aktuelle Momentaufnahme der Elemente bereit, die über eine Vertraulichkeitsbezeichnung oder eine Aufbewahrungsbezeichnung verfügen oder als Typ vertraulicher Informationen in Ihrer Organisation klassifiziert wurden. Administratoren mit den entsprechenden Rollenberechtigungen können damit Detailinformationen für Elemente anzeigen, indem sie auf den in verschiedenen Speichertypen wie Exchange, SharePoint und OneDrive gespeicherten Inhalt der gescannten Quelle zugreifen und diesen anzeigen.

    Der Zugriff auf den Inhaltsexplorer ist stark eingeschränkt, da er das Lesen des Inhalts gescannter Dateien ermöglicht. Ein Benutzer, der Zugriff auf den Inhaltsexplorer benötigt, muss über ein Konto in einer oder mehreren der Rollengruppen des Inhaltsexplorers verfügen.

  • Aktivitätsexplorer: Der Aktivitäten-Explorer bietet Aufschluss darüber, welcher Inhalt ermittelt und bezeichnet wurde und wo sich dieser befindet. Dadurch können Sie überwachen, wie bezeichneter Inhalt in der gesamten Organisationen verwendet wird. Administratoren erhalten Einblicke in Aktivitäten auf Dokumentebene wie Bezeichnungsänderungen und Downgrades (z. B. wenn jemand eine Bezeichnung von „vertraulich“ in „öffentlich“ ändert) oder wenn Dateien auf Wechselmedien oder eine Netzwerkfreigabe kopiert werden.

    Sie verwenden die Filter, um alle Details für eine bestimmte Bezeichnung anzuzeigen, einschließlich Dateitypen, Benutzer und Aktivitäten. Der Aktivitäten-Explorer hilft Ihnen, zu verstehen, wie bezeichneter Inhalt im Zeitverlauf verwendet wird. Administratoren verwenden den Aktivitäten-Explorer, um zu überprüfen, ob bereits vorhandene Steuerelemente wirksam sind.