Condividi tramite


Eseguire l'hashing e caricare la tabella di origine delle informazioni sensibili per i tipi di informazioni sensibili corrispondenti ai dati esatti

Questo articolo illustra come eseguire l'hash e caricare la tabella di origine delle informazioni riservate.

Consiglio

Se non si è cliente E5, usa la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare subito dall'hub delle versioni di valutazione del Portale di conformità di Microsoft Purview. Informazioni dettagliate sui termini di registrazione e prova.

Si applica a

Hash e caricamento della tabella di origine delle informazioni riservate

In questa fase si:

  1. Configurare un gruppo di sicurezza personalizzato e un account utente.
  2. Configurare lo strumento agente di caricamento exact data match (EDM).
  3. Usare lo strumento Agente di caricamento EDM per eseguire l'hash, con un valore salt, la tabella di origine delle informazioni riservate e caricarla.

È possibile eseguire l'hash e caricare i dati sensibili usando il metodo Two-computer o Single computer , come descritto in Hash e caricare i dati. La procedura consigliata consiste nell'usare due computer per separare i processi di hash e caricamento dei dati sensibili. La separazione dei passaggi tra due computer consente di garantire che i dati effettivi non siano mai disponibili in formato non crittografato in un computer che potrebbe essere compromesso a causa della connessione a Internet. Ciò semplifica anche l'identificazione degli eventuali problemi riscontrati.

Prerequisiti

Requisiti tecnologici

  • Un account aziendale o dell'istituto di istruzione per Microsoft 365. Questo account deve essere aggiunto al gruppo di sicurezza EDM_DataUploaders .
  • Un computer con uno dei sistemi operativi seguenti. Questo computer esegue l'agente di caricamento EDM.
    • Windows 11
    • Windows 10
    • Windows Server 2016 con .NET versione 4.6.2
    • Windows Server 2019
    • Windows Server 2022
  • Una directory nel computer usato per caricare i dati. Questa directory contiene:
    • Agente di caricamento EDM.
    • Il file di dati delle informazioni sensibili in formato.csv, tsv o pipe (|). Per impostazione predefinita, l'agente di caricamento EDM prevede che il file di dati sia in formato .csv. > [! SUGGERIMENTO]

      È possibile usare un file con dati separati da tabulazioni o pipe (anziché virgole), indicando le opzioni "(Tab)" o "(|)" con il /ColumnSeparated parametro . Ad esempio: EdmUploadAgent.exe /UploadData /DataStoreName PatientRecords /DataFile C:\Edm\Hash\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5

    • L'output include file salt creati durante il completamento della procedura hash.
    • Nome dell'archivio dati dal file edm.xml . Nell'esempio viene usato PatientRecords.

Requisiti del gruppo di sicurezza e dell'account utente

  1. Come amministratore globale, passare all'interfaccia di amministrazione usando il collegamento appropriato per la sottoscrizione e creare un gruppo di sicurezza denominato EDM_DataUploaders.

  2. Aggiungere uno o più utenti al gruppo di sicurezza EDM_DataUploaders . Questi utenti sono quelli che gestiscono il database delle informazioni riservate.

Schema di corrispondenza dei dati esatti

Se è stato usato lo strumento schema EDM e tipo di informazioni riservate per la nuova esperienza o il pacchetto di regole/tipi di informazioni sensibili EDM per l'esperienza classica, è necessario scaricare lo schema per eseguire l'hash della tabella di origine delle informazioni riservate. Per altre informazioni, vedere Esportazione del file di schema EDM in formato XML.

Per scaricare questo schema EDM, aprire una finestra del prompt dei comandi ed eseguire il comando seguente:

EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>

Requisiti di formattazione dei dati

Prima di eseguire l'hash e caricare i dati sensibili, eseguire una ricerca di eventuali caratteri speciali nella tabella che potrebbero causare problemi nell'analisi del contenuto.

È possibile verificare che la tabella sia in un formato appropriato usando l'agente di caricamento EDM con la sintassi seguente:

EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

Problemi di formattazione comuni

  1. Numero di colonne non corrispondente: Questo problema può essere dovuto alla presenza di virgole o caratteri virgolette all'interno di valori nella tabella che EDM interpreta come delimitatori di colonna. A meno che non circolino un intero valore, virgolette singole e doppie possono causare l'inconveniente dell'inizio e della fine delle singole colonne.
  2. Virgolette singole o virgole all'interno di un valore: Ad esempio, se il nome di una persona include una singola citazione, ad esempio Tom O'Neil o il nome di una città, inizia con un apostrofo, ad esempio 's-Gravenhage, è necessario modificare il processo di esportazione dei dati usato per generare la tabella delle informazioni sensibili e racchiudere tali colonne tra virgolette doppie.
  3. Virgolette doppie all'interno di valori: La procedura consigliata consiste nell'usare il formato delimitato da tabulazioni per la tabella. Le tabelle delimitate da tabulazioni sono meno soggette a tali problemi.

Hash e caricamento dei dati

La tabella di origine delle informazioni riservate è formattata come testo non crittografati. Usando un computer per il passaggio hash e un computer diverso per il passaggio di caricamento, è possibile proteggere i dati dall'esposizione in testo non crittografare in un computer con una connessione diretta al tenant di Microsoft 365.

Importante

Questo approccio richiede che in entrambi i computer sia installata la stessa versione dell'agente di caricamento EDM. È quindi possibile copiare il file hash e il file salt dal computer protetto in un computer in grado di connettersi direttamente al tenant di Microsoft 365.

  1. Nel computer nell'ambiente protetto eseguire il comando seguente in una finestra del prompt dei comandi: EdmUploadAgent.exe /CreateHash /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value] Per esempio: EdmUploadAgent.exe /CreateHash /DataFile C:\Edm\Data\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5

    In questo modo vengono restituiti un file hash e un file salt con queste estensioni se non è stata specificata l'opzione /Salt <saltvalue> :

    • EdmHash
    • EdmSalt
  2. Copiare in modo sicuro questi file nel computer usato per caricare la tabella di origine delle informazioni riservate (ad esempio ,PatientRecords.csv) nel tenant.

  3. Autorizzare l'agente di caricamento EDM:

    1. Come amministratore, aprire una finestra del prompt dei comandi.
    2. Passare alla directory in cui è installato l'agente di caricamento EDM. La directory consigliata è C:\EDM\Data.
    3. Eseguire il comando qui riportato:

    EDM Upload Agent.exe /Authorize

    Importante

    È necessario eseguire l'agente di caricamento EDM dalla cartella in cui è installato ed è necessario indicare il percorso completo dei file di dati.

  4. Accedere con l'account Microsoft 365 aziendale o dell'istituto di istruzione. (Account aggiunto al gruppo di sicurezza EDM_DataUploaders ). Le informazioni del tenant vengono estratte dall'account utente per creare la connessione.

  5. Per caricare i dati con hash, eseguire il comando seguente in una finestra del prompt dei comandi:

    EdmUploadAgent.exe /UploadHash /DataStoreName \<DataStoreName\> /HashFile \<HashedSourceFilePath\ /ColumnSeparator ["{Tab}"|"|"]

    Ad esempio: EdmUploadAgent.exe /UploadHash /DataStoreName PatientRecords /HashFile C:\\Edm\\Hash\\**PatientRecords.EdmHash**

  6. Per verificare che il caricamento dei dati sensibili sia riuscito, eseguire il comando seguente in una finestra del prompt dei comandi:

    EdmUploadAgent.exe /GetDataStore

    Se il caricamento ha avuto esito positivo, viene visualizzato un elenco di archivi dati e l'ultimo aggiornamento.

  7. Per visualizzare tutti i caricamenti di dati in un determinato archivio e, quando sono stati aggiornati, eseguire il comando seguente in una finestra del prompt dei comandi:

    EdmUploadAgent.exe /GetSession /DataStoreName <DataStoreName>

Consiglio

Per automatizzare il processo di caricamento e hash dopo averlo creato la prima volta, vedere Aggiornare i dati esatti che corrispondono al file di tabella dell'origine delle informazioni riservate.

Linguaggi di set di caratteri EDM e set di caratteri a doppio byte

La corrispondenza esatta dei dati supporta caratteri a byte doppio, ad esempio quelli usati in cinese, giapponese e coreano. Tuttavia, non supporta le corrispondenze di stringa per le prove corroborative codificate come caratteri a byte doppio. Né corrisponde al testo CJK multi-token rilevato nel contenuto classificato, a meno che la globalizzazione per EDM non sia abilitata come descritto più avanti in questo documento. In tutti i casi, è necessario eseguire il mapping di un sit a qualsiasi testo multi-token, sia per il campo primario che per i campi di prova corroborativi.

Per richiamare la corrispondenza esatta dei dati per i caratteri a byte doppio, seguire questa procedura:

  1. Creare un tipo di informazioni riservate EDM (SIT) configurato per la corrispondenza nella lingua del set di caratteri a doppio byte, ad esempio il kanji giapponese.
  2. Assicurarsi di scaricare e installare la versione 17.01.0495.0 (o successiva) dell'agente di caricamento EDM
  3. Aggiornare il parametro di globalizzazione del file EdmUploadAgent.exe.config su true: <add key=" IsGlobalizationEnabled" value="true">
  4. Eseguire l'hash e caricare una tabella di origine con i dati da associare.

Passaggi successivi