Eseguire l'hashing e caricare la tabella di origine delle informazioni sensibili per i tipi di informazioni sensibili corrispondenti ai dati esatti
Questo articolo illustra come eseguire l'hash e caricare la tabella di origine delle informazioni riservate.
Consiglio
Se non si è cliente E5, usa la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare subito dall'hub delle versioni di valutazione del Portale di conformità di Microsoft Purview. Informazioni dettagliate sui termini di registrazione e prova.
Si applica a
- Creare una nuova esperienza per il tipo di informazioni sensibili corrispondenza dati esatti
- Creare un'esperienza classica con tipo di informazioni riservate con corrispondenza con dati esatti
Hash e caricamento della tabella di origine delle informazioni riservate
In questa fase si:
- Configurare un gruppo di sicurezza personalizzato e un account utente.
- Configurare lo strumento agente di caricamento exact data match (EDM).
- Usare lo strumento Agente di caricamento EDM per eseguire l'hash, con un valore salt, la tabella di origine delle informazioni riservate e caricarla.
È possibile eseguire l'hash e caricare i dati sensibili usando il metodo Two-computer o Single computer , come descritto in Hash e caricare i dati. La procedura consigliata consiste nell'usare due computer per separare i processi di hash e caricamento dei dati sensibili. La separazione dei passaggi tra due computer consente di garantire che i dati effettivi non siano mai disponibili in formato non crittografato in un computer che potrebbe essere compromesso a causa della connessione a Internet. Ciò semplifica anche l'identificazione degli eventuali problemi riscontrati.
Prerequisiti
Requisiti tecnologici
- Un account aziendale o dell'istituto di istruzione per Microsoft 365. Questo account deve essere aggiunto al gruppo di sicurezza EDM_DataUploaders .
- Un computer con uno dei sistemi operativi seguenti. Questo computer esegue l'agente di caricamento EDM.
- Windows 11
- Windows 10
- Windows Server 2016 con .NET versione 4.6.2
- Windows Server 2019
- Windows Server 2022
- Una directory nel computer usato per caricare i dati. Questa directory contiene:
- Agente di caricamento EDM.
- Il file di dati delle informazioni sensibili in formato.csv, tsv o pipe (|). Per impostazione predefinita, l'agente di caricamento EDM prevede che il file di dati sia in formato .csv.
> [! SUGGERIMENTO]
È possibile usare un file con dati separati da tabulazioni o pipe (anziché virgole), indicando le opzioni "(Tab)" o "(|)" con il
/ColumnSeparated
parametro . Ad esempio:EdmUploadAgent.exe /UploadData /DataStoreName PatientRecords /DataFile C:\Edm\Hash\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5
- L'output include file salt creati durante il completamento della procedura hash.
- Nome dell'archivio dati dal file edm.xml . Nell'esempio viene usato
PatientRecords
.
Requisiti del gruppo di sicurezza e dell'account utente
Come amministratore globale, passare all'interfaccia di amministrazione usando il collegamento appropriato per la sottoscrizione e creare un gruppo di sicurezza denominato EDM_DataUploaders.
Aggiungere uno o più utenti al gruppo di sicurezza EDM_DataUploaders . Questi utenti sono quelli che gestiscono il database delle informazioni riservate.
Schema di corrispondenza dei dati esatti
Se è stato usato lo strumento schema EDM e tipo di informazioni riservate per la nuova esperienza o il pacchetto di regole/tipi di informazioni sensibili EDM per l'esperienza classica, è necessario scaricare lo schema per eseguire l'hash della tabella di origine delle informazioni riservate. Per altre informazioni, vedere Esportazione del file di schema EDM in formato XML.
Per scaricare questo schema EDM, aprire una finestra del prompt dei comandi ed eseguire il comando seguente:
EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>
Requisiti di formattazione dei dati
Prima di eseguire l'hash e caricare i dati sensibili, eseguire una ricerca di eventuali caratteri speciali nella tabella che potrebbero causare problemi nell'analisi del contenuto.
È possibile verificare che la tabella sia in un formato appropriato usando l'agente di caricamento EDM con la sintassi seguente:
EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]
Problemi di formattazione comuni
- Numero di colonne non corrispondente: Questo problema può essere dovuto alla presenza di virgole o caratteri virgolette all'interno di valori nella tabella che EDM interpreta come delimitatori di colonna. A meno che non circolino un intero valore, virgolette singole e doppie possono causare l'inconveniente dell'inizio e della fine delle singole colonne.
- Virgolette singole o virgole all'interno di un valore: Ad esempio, se il nome di una persona include una singola citazione, ad esempio Tom O'Neil o il nome di una città, inizia con un apostrofo, ad esempio 's-Gravenhage, è necessario modificare il processo di esportazione dei dati usato per generare la tabella delle informazioni sensibili e racchiudere tali colonne tra virgolette doppie.
- Virgolette doppie all'interno di valori: La procedura consigliata consiste nell'usare il formato delimitato da tabulazioni per la tabella. Le tabelle delimitate da tabulazioni sono meno soggette a tali problemi.
Hash e caricamento dei dati
La tabella di origine delle informazioni riservate è formattata come testo non crittografati. Usando un computer per il passaggio hash e un computer diverso per il passaggio di caricamento, è possibile proteggere i dati dall'esposizione in testo non crittografare in un computer con una connessione diretta al tenant di Microsoft 365.
Importante
Questo approccio richiede che in entrambi i computer sia installata la stessa versione dell'agente di caricamento EDM. È quindi possibile copiare il file hash e il file salt dal computer protetto in un computer in grado di connettersi direttamente al tenant di Microsoft 365.
Nel computer nell'ambiente protetto eseguire il comando seguente in una finestra del prompt dei comandi:
EdmUploadAgent.exe /CreateHash /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value]
Per esempio:EdmUploadAgent.exe /CreateHash /DataFile C:\Edm\Data\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5
In questo modo vengono restituiti un file hash e un file salt con queste estensioni se non è stata specificata l'opzione /
Salt <saltvalue>
:- EdmHash
- EdmSalt
Copiare in modo sicuro questi file nel computer usato per caricare la tabella di origine delle informazioni riservate (ad esempio ,PatientRecords.csv) nel tenant.
Autorizzare l'agente di caricamento EDM:
- Come amministratore, aprire una finestra del prompt dei comandi.
- Passare alla directory in cui è installato l'agente di caricamento EDM. La directory consigliata è C:\EDM\Data.
- Eseguire il comando qui riportato:
EDM Upload Agent.exe /Authorize
Importante
È necessario eseguire l'agente di caricamento EDM dalla cartella in cui è installato ed è necessario indicare il percorso completo dei file di dati.
Accedere con l'account Microsoft 365 aziendale o dell'istituto di istruzione. (Account aggiunto al gruppo di sicurezza EDM_DataUploaders ). Le informazioni del tenant vengono estratte dall'account utente per creare la connessione.
Per caricare i dati con hash, eseguire il comando seguente in una finestra del prompt dei comandi:
EdmUploadAgent.exe /UploadHash /DataStoreName \<DataStoreName\> /HashFile \<HashedSourceFilePath\ /ColumnSeparator ["{Tab}"|"|"]
Ad esempio:
EdmUploadAgent.exe /UploadHash /DataStoreName PatientRecords /HashFile C:\\Edm\\Hash\\**PatientRecords.EdmHash**
Per verificare che il caricamento dei dati sensibili sia riuscito, eseguire il comando seguente in una finestra del prompt dei comandi:
EdmUploadAgent.exe /GetDataStore
Se il caricamento ha avuto esito positivo, viene visualizzato un elenco di archivi dati e l'ultimo aggiornamento.
Per visualizzare tutti i caricamenti di dati in un determinato archivio e, quando sono stati aggiornati, eseguire il comando seguente in una finestra del prompt dei comandi:
EdmUploadAgent.exe /GetSession /DataStoreName <DataStoreName>
Consiglio
Per automatizzare il processo di caricamento e hash dopo averlo creato la prima volta, vedere Aggiornare i dati esatti che corrispondono al file di tabella dell'origine delle informazioni riservate.
Linguaggi di set di caratteri EDM e set di caratteri a doppio byte
La corrispondenza esatta dei dati supporta caratteri a byte doppio, ad esempio quelli usati in cinese, giapponese e coreano. Tuttavia, non supporta le corrispondenze di stringa per le prove corroborative codificate come caratteri a byte doppio. Né corrisponde al testo CJK multi-token rilevato nel contenuto classificato, a meno che la globalizzazione per EDM non sia abilitata come descritto più avanti in questo documento. In tutti i casi, è necessario eseguire il mapping di un sit a qualsiasi testo multi-token, sia per il campo primario che per i campi di prova corroborativi.
Per richiamare la corrispondenza esatta dei dati per i caratteri a byte doppio, seguire questa procedura:
- Creare un tipo di informazioni riservate EDM (SIT) configurato per la corrispondenza nella lingua del set di caratteri a doppio byte, ad esempio il kanji giapponese.
- Assicurarsi di scaricare e installare la versione 17.01.0495.0 (o successiva) dell'agente di caricamento EDM
- Aggiornare il parametro di globalizzazione del file EdmUploadAgent.exe.config su true:
<add key=" IsGlobalizationEnabled" value="true">
- Eseguire l'hash e caricare una tabella di origine con i dati da associare.
Passaggi successivi
Per la nuova esperienza: testare un tipo di informazioni sensibili esatto per la corrispondenza dei dati
Per l'esperienza classica: creare dati esatti corrispondenti a tipo di informazioni riservate/pacchetto di regole