Partilhar via


Hash e carregue a tabela de fonte de informações confidenciais para tipos de informações confidenciais de correspondência exata de dados

Este artigo mostra-lhe como fazer hash e carregar a tabela de origem de informações confidenciais.

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Aplicável a

Hash e carregar a tabela de origem de informações confidenciais

Nesta fase, irá:

  1. Configure um grupo de segurança personalizado e uma conta de utilizador.
  2. Configure a ferramenta Agente de Carregamento de Correspondência de Dados Exata (EDM).
  3. Utilize a ferramenta EDM Upload Agent para hash, com um valor de sal, a tabela de origem de informações confidenciais e carregue-a.

Pode hash e carregar os seus dados confidenciais através do método De dois computadores ou do método De computador único , conforme descrito em Hash, e carregar os seus dados. A melhor prática é utilizar dois computadores para separar os processos de hashing e carregamento dos seus dados confidenciais. Separar os passos entre dois computadores ajuda a garantir que os seus dados reais nunca estão disponíveis em formato de texto não encriptado num computador que possa estar comprometido devido à respetiva ligação à Internet. Isto também torna mais fácil identificar os problemas que encontrar.

Pré-requisitos

Requisitos de tecnologia

  • Uma conta escolar ou profissional para o Microsoft 365. Esta conta tem de ser adicionada ao grupo de segurança EDM_DataUploaders .
  • Um computador com um dos seguintes sistemas operativos. Este computador executa o Agente de Carregamento EDM.
    • Windows 11
    • Windows 10
    • Windows Server 2016 com a versão 4.6.2 do .NET
    • Windows Server 2019
    • Windows Server 2022
  • Um diretório no computador que utiliza para carregar os seus dados. Este diretório contém:
    • O Agente de Carregamento do EDM.
    • O ficheiro de dados de informações confidenciais no formato .csv, .tsv ou pipe (|). Por predefinição, o Agente de Carregamento do EDM espera que o ficheiro de dados esteja no formato .csv. > [! SUGESTÃO]

      Pode utilizar um ficheiro com dados separados por tabulações ou pipes (em vez de vírgulas), ao indicar as opções "(Tab)" ou "(|)" com o /ColumnSeparated parâmetro . Por exemplo: EdmUploadAgent.exe /UploadData /DataStoreName PatientRecords /DataFile C:\Edm\Hash\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5

    • A saída tem ficheiros salt e que são criados ao concluir o procedimento hash.
    • O nome do arquivo de dados do ficheiro edm.xml . O nosso exemplo utiliza PatientRecords.

Requisitos do grupo de segurança e da conta de utilizador

  1. Como administrador global, aceda ao centro de administração com a ligação adequada para a sua subscrição e crie um grupo de segurança chamado EDM_DataUploaders.

  2. Adicione um ou mais utilizadores ao grupo de segurança EDM_DataUploaders . (Estes utilizadores são os que gerem a base de dados de informações confidenciais.)

Esquema de Correspondência de Dados Exata

Se utilizou o esquema EDM e a ferramenta de tipo de informações confidenciais para a nova experiência ou o pacote de tipo/regra de informações confidenciais do EDM para a experiência clássica, tem de transferir esse esquema para criar um hash na tabela de origem de informações confidenciais. Para obter mais informações, veja Exportar o ficheiro de esquema EDM no formato XML.

Para transferir este esquema EDM, abra uma janela da Linha de Comandos e execute o seguinte comando:

EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>

Requisitos de formatação de dados

Antes de hash e carregar os seus dados confidenciais, execute uma pesquisa de quaisquer carateres especiais na tabela que possam causar problemas na análise do conteúdo.

Pode validar se a tabela está num formato adequado ao utilizar o Agente de Carregamento EDM com a seguinte sintaxe:

EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

Problemas comuns de formatação

  1. Número de colunas sem correspondência: Este problema pode dever-se à presença de vírgulas ou carateres de aspas dentro dos valores na tabela que o EDM interpreta como delimitadores de colunas. A menos que estejam à volta de um valor inteiro, as aspas simples e duplas podem fazer com que a ferramentaidentifique mal o início e o fim das colunas individuais.
  2. Carateres de plica ou vírgulas dentro de um valor: Por exemplo, se o nome de uma pessoa incluir uma plica, como Tom O'Neil ou o nome de uma cidade, começa com um apóstrofo como "s-Gravenhage", terá de modificar o processo de exportação de dados utilizado para gerar a tabela de informações confidenciais e rodear essas colunas com aspas duplas.
  3. Carateres de aspas duplas dentro dos valores: A melhor prática é utilizar o formato delimitado por tabulações para a tabela. As tabelas delimitadas por tabulações são menos suscetíveis a tais problemas.

Hash e carregar os seus dados

A tabela de origem de informações confidenciais está formatada como texto não encriptado. Ao utilizar um computador para o passo hash e um computador diferente para o passo de carregamento, protege os seus dados de serem expostos em texto não encriptado num computador com uma ligação direta ao seu inquilino do Microsoft 365.

Importante

Esta abordagem requer que a mesma versão do Agente de Carregamento EDM tenha de ser instalada em ambos os computadores. Em seguida, pode copiar o ficheiro hash e o ficheiro salt do computador seguro para um computador que se possa ligar diretamente ao seu inquilino do Microsoft 365.

  1. No computador no ambiente seguro, execute o seguinte comando numa janela da Linha de Comandos: EdmUploadAgent.exe /CreateHash /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value] Por exemplo: EdmUploadAgent.exe /CreateHash /DataFile C:\Edm\Data\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5

    Esta ação produz um ficheiro hash e um ficheiro salt com estas extensões se não tiver especificado a opção /Salt <saltvalue> :

    • EdmHash
    • EdmSalt
  2. Copie estes ficheiros de forma segura para o computador que utiliza para carregar a tabela de origem de informações confidenciais (por exemplo, PatientRecords.csv) para o seu inquilino.

  3. Autorizar o Agente de Carregamento do EDM:

    1. Como administrador, abra uma janela da Linha de Comandos.
    2. Mude para o diretório onde o Agente de Carregamento EDM está instalado. (O diretório recomendado é C:\EDM\Data.)
    3. Execute o seguinte comando:

    EDM Upload Agent.exe /Authorize

    Importante

    Tem de executar o Agente de Carregamento do EDM a partir da pasta onde está instalado e tem de sindicar o caminho completo para os seus ficheiros de dados.

  4. Inicie sessão com a sua conta escolar ou profissional do Microsoft 365. (A conta que foi adicionada ao grupo de segurança EDM_DataUploaders ). As informações do locatário são extraídas da conta do usuário para fazer a conexão.

  5. Para carregar os dados com hash, execute o seguinte comando numa janela da Linha de Comandos:

    EdmUploadAgent.exe /UploadHash /DataStoreName \<DataStoreName\> /HashFile \<HashedSourceFilePath\ /ColumnSeparator ["{Tab}"|"|"]

    Por exemplo: EdmUploadAgent.exe /UploadHash /DataStoreName PatientRecords /HashFile C:\\Edm\\Hash\\**PatientRecords.EdmHash**

  6. Para verificar se o carregamento dos dados confidenciais foi efetuado com êxito, execute o seguinte comando numa janela da Linha de Comandos:

    EdmUploadAgent.exe /GetDataStore

    Se o carregamento tiver sido efetuado com êxito, é apresentada uma lista de arquivos de dados e quando foram atualizados pela última vez.

  7. Para apresentar todos os carregamentos de dados para um arquivo específico e quando foram atualizados, execute o seguinte comando numa janela da Linha de Comandos:

    EdmUploadAgent.exe /GetSession /DataStoreName <DataStoreName>

Dica

Para automatizar o hash e carregar o processo depois de o ter criado pela primeira vez, consulte Atualizar o ficheiro de tabela da origem de informações confidenciais atualizar os dados exatos.

Idiomas do conjunto de carateres EDM e byte duplo

A correspondência de dados exata suporta carateres de bytes duplos, como os utilizados em chinês, japonês e coreano. No entanto, não suporta correspondências de cadeias para provas corroborativas codificadas como carateres de byte duplo. Também não corresponde ao texto CJK de vários tokens detetado no conteúdo classificado, a menos que a globalização do EDM esteja ativada, conforme descrito mais à frente neste documento. Em todos os casos, um SIT tem de ser mapeado para qualquer texto com vários tokens, tanto para o campo primário como para campos de provas corroborativas.

Para invocar a correspondência exata de dados para carateres de byte duplo, siga os seguintes passos:

  1. Crie um Tipo de Informação Sensível (SIT) EDM configurado para corresponder ao idioma do conjunto de carateres de byte duplo, como o kanji japonês.
  2. Certifique-se de que transfere e instala a versão 17.01.0495.0 (ou posterior) do Agente de Carregamento do EDM
  3. Atualize o parâmetro de globalização do ficheiro EdmUploadAgent.exe.config para verdadeiro: <add key=" IsGlobalizationEnabled" value="true">
  4. Hash e carregue uma tabela de origem com os dados a serem correspondidos.

Próximas etapas