Datenabgleich für Anträge auf Rechte betroffener Personen
Mit Dem Datenabgleich können Organisationen Microsoft Priva ermöglichen, betroffene Personen basierend auf genau angegebenen Datenwerten zu identifizieren. Dies kann dazu beitragen, die Genauigkeit der Suche nach Inhalten betroffener Personen zu erhöhen, die diesen Datenwerten entsprechen, sowohl für Ihr internes Personal als auch für externe Benutzer, mit denen Sie interagieren. Es vereinfacht auch die Notwendigkeit, Felder während der Erstellung von Antragstellerrechten manuell anzugeben, und bietet Kontext innerhalb von Anträgen auf Antragstellerrechte und für die Kachel Übersicht, auf der Ihre Elemente mit den meisten inhalten der betroffenen Person angezeigt werden. Weitere Informationen zu dieser Ansicht finden Sie unter Suchen und Visualisieren personenbezogener Daten in Priva.
Um das Datenabgleichsfeature verwenden zu können, müssen Sie Mitglied der Rollengruppe "Datenschutzverwaltung" sein. Wählen Sie in Priva im Microsoft Purview-Complianceportal im oberen Navigationsbereich Einstellungen und dann Datenabgleich aus. Von hier aus müssen Sie das Schema für personenbezogene Daten definieren und einen Upload personenbezogener Daten bereitstellen, wie unten gezeigt. Beachten Sie, dass Sie Elemente hinzufügen und elemente löschen können, die Sie hinzufügen, aber kein Element ändern können.
Vorbereiten des Datenimports
Bevor Sie das Schema definieren oder Daten hochladen, müssen Sie die Quelle ihrer Datensubjektinformationen identifizieren. Das erforderliche Dateiformat ist .csv, das von einer Anwendung wie Microsoft Excel gelesen werden kann. Strukturieren Sie diesen Export so, dass Ihre Spaltenüberschriften in der ersten Zeile angezeigt werden. Diese Header sollten die Namen der Attribute für Ihr persönliches Datenschema enthalten. Überprüfen Sie das Format der Daten in jedem Feld. Wenn eines der Daten Kommas enthält, schließen Sie diese Werte in doppelte Anführungszeichen ein, um sicherzustellen, dass sie nicht in separate Felder analysiert werden.
Definieren des Schemas für personenbezogene Daten
Der erste Schritt beim Einrichten des Datenabgleichs besteht darin, das Schema für personenbezogene Daten zu definieren, das die Attribute für Ihre betroffenen Personen beschreibt. Sie laden dieses Schema auf der ersten Registerkarte im Bereich datenabgleichseinstellungen hoch. Die erforderlichen Dateien umfassen eine XML-Datei für das persönliche Datenschema und eine XML-Datei für das Regelpaket .
Schema-XML für personenbezogene Daten
Die Schemadatei für persönliche Daten ist eine XML-Datei, die definiert, welche Spaltennamen erwartet werden.
- Benennen Sie diese Schemadatei pdm.xml.
- Definieren Sie die einzelnen Spaltennamen mithilfe des Feldnamentags, wie im folgenden Beispiel gezeigt.
- Verwenden Sie searchable = "true" für Felder, die durchsuchbar sein sollen, bis zu maximal fünf Felder. Mindestens einer Ihrer Feldnamen muss durchsuchbar sein. Beispielsyntax:
\<Field name="" searchable=""/>
. - Das Schema für personenbezogene Daten verfügt über einen Datenspeichertagabschnitt. Ihren Feldnamen müssen vier Pflichtfelder zugeordnet werden: primaryKeyField, upnField, firstNameField, lastNameField.
Die folgende XML-Datei definiert beispielsweise ein Beispielschema mit fünf als durchsuchbaren Feldern: PatientID, MRN, SSN, Phone und DOB. Das primaryKeyField wird PatientID zugeordnet, upnField ist MRN zugeordnet, firstNameField wird FirstNameField und lastNameField LastName zugeordnet.
Sie können unser Beispiel kopieren, ändern und verwenden.
<PdmSchema xmlns="http://schemas.microsoft.com/office/2020/pdm">
<DataStore name="Patientrecords" description="Schema for patient records" version="1" primaryKeyField="PatientID" upnField="MRN" firstNameField="FirstName" lastNameField="LastName">
<Field name="PatientID" searchable="true"/>
<Field name="MRN" searchable="true" />
<Field name="FirstName" />
<Field name="LastName" />
<Field name="SSN" searchable="true" />
<Field name="Phone" searchable="true" />
<Field name="DOB" searchable="true" />
<Field name="Gender" />
<Field name="Address" />
</DataStore>
</PdmSchema>
Regelpaket-XML
Wenn Sie Ihr Regelpaket einrichten, stellen Sie sicher, dass Sie ordnungsgemäß auf Ihre oben erstellte Schemadatei für persönliche Daten verweisen: pdm.xml. Im folgenden Beispielregelpaket-XML müssen die folgenden Felder angepasst werden, um die Daten zu erstellen, die dem vertraulichen Typ entsprechen:
- RulePack-ID & PrivacyMatch-ID: Verwenden Sie New-GUID, um eine GUID zu generieren.
- Datenspeicher: Dieses Feld gibt den zu verwendenden Nachschlagedatenspeicher für die Übereinstimmung personenbezogener Daten an. Geben Sie den definierten Datenspeichernamen eines konfigurierten Schemas für personenbezogene Daten an.
-
idMatch: Dieses Feld zeigt auf das primäre Element für die Übereinstimmung mit personenbezogenen Daten.
- Übereinstimmungen: Gibt das Feld an, das bei der genauen Suche verwendet werden soll. Geben Sie einen durchsuchbaren Feldnamen aus dem Schema für personenbezogene Daten an.
- Klassifizierung: Dieses Feld gibt die Übereinstimmung mit vertraulichen Typen an, die die Suche nach übereinstimmungen personenbezogenen Daten auslöst. Sie können den Namen oder die GUID eines vorhandenen integrierten oder benutzerdefinierten vertraulichen Informationstyps angeben. Um Leistungsprobleme zu vermeiden, verwenden Sie, wenn Sie einen benutzerdefinierten vertraulichen Informationstyp als Klassifizierungselement in der Übereinstimmung mit personenbezogenen Daten verwenden, keinen benutzerdefinierten vertraulichen Informationstyp, der einem großen Prozentsatz des Inhalts entspricht (z. B. "beliebige Zahl" oder "beliebiges Wort mit fünf Buchstaben"). Es wird empfohlen, unterstützende Schlüsselwörter oder Formatierungen in die Definition des benutzerdefinierten Typs vertraulicher Klassifizierungsinformationen aufzunehmen.
-
Übereinstimmung: Dieses Feld verweist auf zusätzliche Beweise, die in der Nähe von idMatch gefunden wurden.
- Übereinstimmungen: Geben Sie einen beliebigen Feldnamen im Schema für personenbezogene Daten für DataStore an.
-
Ressource: In diesem Abschnitt werden der Name und die Beschreibung für den vertraulichen Typ in mehreren Gebietsschemas angegeben.
- idRef: Geben Sie die GUID für ExactMatch-ID an.
- Name & Beschreibungen: Anpassen nach Bedarf.
In unserem folgenden XML-Beispiel für das Regelpaket verweisen wir auf die pdm.xml Beispieldatei aus dem vorherigen Schritt, mit der die XML-Datei des Schemas für personenbezogene Daten erstellt wird:
- Datenspeicher: Der Name des Datenspeichers verweist auf die schemadatei, die wir zuvor erstellt haben: dataStore = "PatientRecords".
-
idMatch: Der idMatch-Wert verweist auf ein durchsuchbares Feld, das in der zuvor erstellten pdm.xml Datei aufgeführt ist: idMatch matches = "SSN".
- Klassifizierung: Der Klassifizierungswert verweist auf einen vorhandenen oder benutzerdefinierten vertraulichen Informationstyp: classification = "U.S. Social Security Number (SSN)". (In diesem Fall verwenden wir den vorhandenen Vertraulichen Informationstyp US-Sozialversicherungsnummer.)
Erstellen Sie wie im folgenden Beispielcode ein Regelpaket im XML-Format (mit Unicode-Codierung). Sie können dieses Beispiel kopieren, ändern und verwenden.
<RulePackage xmlns="http://schemas.microsoft.com/office/2020/pdm">
<RulePack id="fd098e03-1796-41a5-8ab6-198c93c62b21">
<Version build="0" major="2" minor="0" revision="0" />
<Publisher id="eb553734-8306-44b4-9ad5-c388ad970528" />
<Details defaultLangCode="en-us">
<LocalizedDetails langcode="en-us">
<PublisherName>IP DLP</PublisherName>
<Name>Health Care PDM Rulepack</Name>
<Description>This rule package contains the Personal Data Match sensitive type for health care sensitive types.</Description>
</LocalizedDetails>
</Details>
</RulePack>
<Rules>
<PrivacyMatch id = "E1CC861E-3FE9-4A58-82DF-4BD259EAB381" patternsProximity = "300" dataStore ="PatientRecords" recommendedConfidence = "65" >
<Pattern confidenceLevel="65">
<idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" />
</Pattern>
<Pattern confidenceLevel="75">
<idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" />
<Any minMatches ="3" maxMatches ="6">
<match matches="PatientID" />
<match matches="MRN"/>
<match matches="FirstName"/>
<match matches="LastName"/>
<match matches="Phone"/>
<match matches="DOB"/>
</Any>
</Pattern>
</PrivacyMatch>
<LocalizedStrings>
<Resource idRef="E1CC861E-3FE9-4A58-82DF-4BD259EAB381">
<Name default="true" langcode="en-us">Patient SSN Exact Match.</Name>
<Description default="true" langcode="en-us">PDM Sensitive type for detecting Patient SSN.</Description>
</Resource>
</LocalizedStrings>
</Rules>
</RulePackage>
Typen vertraulicher Informationen
Der zweite Schritt beim Einrichten des Datenabgleichs besteht darin, eindeutige Typen vertraulicher Informationen für die Übereinstimmung mit personenbezogenen Daten (PDM) zu erstellen. Typen vertraulicher Informationen (SITs) sind musterbasierte Klassifizierer, die vertrauliche Informationen wie Sozialversicherungs- oder Kreditkartennummern erkennen. Durch das Einrichten eines PDM-Typs für vertrauliche Informationen können Sie genaue Datenwerte anstelle generischer Werte verwenden, um Übereinstimmungen zu erkennen. Um mit diesem Schritt zu beginnen, wählen Sie Vertraulichen PDM-Informationstyp erstellen aus, um den Erstellungs-Assistenten zu starten.
Hochladen personenbezogener Daten
Nach der Definition des Schemas für personenbezogene Daten und der Typen vertraulicher Informationen besteht der dritte Schritt darin, personenbezogene Daten hochzuladen. Wechseln Sie zur Registerkarte Hochladen personenbezogener Daten , wählen Sie Hinzufügen aus, und wählen Sie das persönliche Schema aus, das Sie im ersten Schritt definiert haben, und laden Sie dann die Datei mit den personenbezogenen Daten hoch.
Sie können diese personenbezogenen Daten hochladen, indem Sie eine lokale Datei auswählen oder eine SAS-URL für einen vorhandenen Microsoft Azure Storage-Speicherort angeben, der Ihre persönliche Datendatei enthält. Wenn Sie als ersten Schritt in diesem Prozess eine Datei vorbereitet haben, die dem erstellten Schema entspricht, können Sie diese Datei für den Upload verwenden.