Compartilhar via


Crie um tipo de informação confidencial/pacote de regras de correspondência exata de dados

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Aplicável a

Pode criar uma correspondência de dados exata (EDM) SIT (SIT) com a ferramenta Utilizar o esquema de Correspondência de Dados Exata e o padrão SIT no Portal de Conformidade do Microsoft Purview ou pode criar o pacote de regras manualmente como um ficheiro XML. Também pode combinar os dois métodos com um método para criar o esquema e, posteriormente, utilizar o outro método para editá-lo.

Se não estiver familiarizado com o SITS baseado em EDM ou com a respetiva implementação, deve familiarizar-se com:

Pré-requisitos

Execute os passos nestes artigos:

  1. Exportar dados de origem para tipos de informações confidenciais baseados em correspondência de dados exatas
  2. Criar o esquema para tipos de informações confidenciais com base em correspondência exata de dados
  3. Hash e carregue a tabela de fonte de informações confidenciais para tipos de informações confidenciais de correspondência exata de dados
  • Quer esteja a criar um SIT EDM com a ferramenta ou o ficheiro XML do pacote de regras através do PowerShell, tem de ter permissões de Administrador Global ou Administrador de Conformidade para criar, testar e implementar um SIT personalizado através da IU. Veja Acerca das funções de administrador no Office 365.

Importante

A Microsoft recomenda que você use funções com o menor número de permissões. Isto ajuda a melhorar a segurança da sua organização. O Administrador Global é uma função altamente privilegiada que só deve ser utilizada em cenários em que não é possível utilizar uma função com privilégios menores.

  • Identifique um dos SITs incorporados a utilizar como os Elementos primários SIT.
    • Se nenhum dos SITs incorporados corresponder aos dados na coluna que selecionou, terá de criar um SIT personalizado que o faça.
    • Se tiver selecionado a opção Delimitadores Ignorados para a coluna do elemento principal no seu esquema, certifique-se de que o SIT personalizado que criar corresponderá aos dados com e sem os delimitadores selecionados.
    • Se utilizar um SIT incorporado, certifique-se de que deteta exatamente as cadeias que pretende selecionar e não inclui quaisquer carateres adjacentes ou exclua qualquer parte válida da cadeia, conforme armazenado na sua tabela de informações confidenciais.

Veja Definições de entidades de tipo de informações confidenciais e Criar tipos de informações confidenciais personalizados.

Utilizar o esquema de Correspondência de Dados Exata e a ferramenta de padrão SIT

Pode utilizar esta ferramenta para criar os seus ficheiros SIT para ajudar a simplificar o processo.

Um SIT EDM é composto por um ou mais padrões. Cada padrão descreve uma combinação de campos do esquema que será utilizada para identificar conteúdos confidenciais num documento ou e-mail (provas).

Selecione a guia apropriada para o portal que você está usando. Dependendo do seu plano do Microsoft 365, o portal de conformidade do Microsoft Purview será descontinuado ou será descontinuado em breve.

Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o Portal de conformidade, consulte Portal de conformidade do Microsoft Purview.

  1. Inicie sessão no portal > do Microsoft PurviewProteção de Informações>ClassifiersEDM classifiers>.

    1. Defina o botão de alternar Nova experiência do EDM como Desativado
  2. Escolha tipos de informações confidenciais EDM e Criar tipo de informações confidenciais EDM para abrir a ferramenta de configuração Tipo de Informação Confidencial.

  3. Selecione Escolher um esquema EDM existente e escolha o esquema que criou em Criar o esquema para tipos de informações confidenciais baseados em correspondência de dados exatas. Selecione Adicionar.

  4. Escolha Próximo e escolha Criar padrão.

  5. Selecione o nível de Confiança e o elemento Primário. Para saber mais sobre os níveis de confiança, veja Saiba mais sobre tipos de informações confidenciais.

  6. Escolha o tipo de informações confidenciais do elemento Primário ao qual deve associá-lo para definir o texto no documento que será comparado com todos os valores no campo do elemento primário. Veja Definições de Entidade SIT para saber mais sobre os tipos de informações confidenciais disponíveis.

    Importante

    Selecione um SIT que corresponda de perto ao formato do conteúdo que pretende localizar. Selecionar um SIT que corresponda a conteúdos desnecessários, como um que corresponda a todas as cadeias de texto ou todos os números, pode causar uma carga excessiva no sistema, o que pode fazer com que as informações confidenciais fiquem por detetar.

  7. Selecione os elementos de Suporte e as opções de correspondência.

  8. Escolha Concluído.

  9. Selecione Criar padrão se quiser criar padrões adicionais para o seu SIT EDM.

  10. Selecione Avançar.

  11. Escolha o nível de confiança recomendado pretendido e a Proximidade de carateres. Este será o valor predefinido para todo o SIT EDM. (Para obter informações sobre a proximidade de carateres, veja Compreender a proximidade). Selecione Avançar.

  12. Escolha Próximo e preencha oNome e Descrição para os administradores.

    À medida que cria o ficheiro de esquema, os cabeçalhos de coluna (campos de dados) têm de cumprir os seguintes requisitos de nomenclatura:
    - Tem de começar com uma letra e tem de consistir em, pelo menos, três carateres alfanuméricos.
    - Tem de incluir apenas carateres alfanuméricos.

  13. Examine e escolha Enviar.

Editar ou eliminar um padrão SIT

Selecione a guia apropriada para o portal que você está usando. Dependendo do seu plano do Microsoft 365, o portal de conformidade do Microsoft Purview será descontinuado ou será descontinuado em breve.

Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o Portal de conformidade, consulte Portal de conformidade do Microsoft Purview.

  1. Inicie sessão no portal > do Microsoft PurviewProteção de Informações>ClassifiersEDM classifiers>.

    1. Defina o botão de alternar Nova experiência do EDM como Desativado
  2. Escolha tipos de informações confidenciais EDM.

  3. Selecione o SIT EDM que pretende editar.

  4. Selecione Editar tipo de informações confidenciais EDM ou Eliminar tipo de informações confidenciais EDM na lista de opções.

  5. Veja Utilizar o esquema de Correspondência de Dados Exata e a ferramenta padrão SIT para os procedimentos de edição.

Trabalhar com tipos específicos de dados

Por motivos de desempenho, é fundamental que utilize padrões que minimizem o número de correspondências desnecessárias. Por exemplo, pode utilizar um SIT com base na expressão regular.

\b\w*\b

Isto corresponderia a cada palavra ou número individual em qualquer documento ou e-mail. Isto faria com que o serviço estivesse sobrecarregado com correspondências e falhasse ao detetar correspondências verdadeiras. A utilização de padrões mais precisos pode evitar esta situação. Seguem-se algumas recomendações para identificar a configuração certa para alguns tipos comuns de dados.

Email endereços: Email endereços podem ser fáceis de identificar, mas como são tão comuns em conteúdos confidenciais, podem causar uma carga significativa no sistema se forem utilizados como um campo primário. Utilize os suplementos de e-mail apenas como prova secundária. Se tiverem de ser utilizados como prova principal, quando definir a lógica de utilização personalizada do SIT para excluir itens em que os endereços de e-mail são utilizados como From ou To campos em e-mails. Utilize também a lógica para excluir endereços de e-mail do domínio da sua empresa para reduzir o número de cadeias desnecessárias que têm de ser correspondidas.

Números de telefone: os números de telefone podem ter vários formatos diferentes, incluindo ou excluindo prefixos de país/região, códigos de área e separadores. Para reduzir os falsos negativos mantendo a carga no mínimo, utilize-os apenas como elementos secundários, exclua todos os separadores prováveis, como parênteses e travessões e inclua apenas na tabela de dados confidenciais a parte que estará sempre presente no número de telefone.

Pessoas nomes: não utilize os nomes das pessoas como elementos principais se utilizar um SIT baseado numa expressão regular como elemento de classificação para este tipo de EDM, porque são difíceis de distinguir de palavras comuns.

Se tiver de utilizar um elemento primário difícil de identificar com um padrão específico (como um nome de código de projeto), que possa gerar um elevado volume de correspondências a processar, certifique-se de que inclui palavras-chave no SIT que utiliza como elemento de classificação para o seu tipo de EDM. Por exemplo, se utilizar nomes de código de projeto que também são palavras normais, pode utilizar a palavra project como prova adicional necessária perto do padrão regular baseado na expressão do nome do projeto no SIT que utiliza como elemento de classificação para o seu tipo de EDM. Em alternativa, pode considerar utilizar um SIT baseado num dicionário normal como elemento de classificação para o seu SIT EDM.

Ao tentar corresponder cadeias numéricas, especifique os intervalos de números permitidos, como o número de dígitos ou os dígitos iniciais, se conhecidos. Se precisar de corresponder a um intervalo de números relativamente flexível, pode utilizar palavras-chave no SIT base para reduzir o número de correspondências. Por exemplo, se tentar corresponder os números de conta que consistem em 7-11 dígitos, adicione as palavras account, customer, acct. ao SIT como prova adicional necessária. Isto reduz a probabilidade de correspondências desnecessárias que podem resultar em exceder os limites de correspondências EDM que podem ser processadas.

Se um campo que precisa de utilizar como elemento primário seguir um padrão simples que possa resultar num grande número de correspondências e não conseguir adicionar a presença de palavras-chave como prova adicional no SIT, pode, em vez disso, exigir um número mínimo de ocorrências desse padrão. Por exemplo, pode utilizar um SIT personalizado definido da seguinte forma para detetar, pelo menos, 29 outros números de cinco dígitos em torno de um número potencial de cinco dígitos para corresponder no seu conteúdo confidencial:

 <Entity id="98703510-18b3-43d4-961f-15317594beb7"
                  patternsProximity="300"
                  recommendedConfidence="85"
                  relaxProximity="false">
                  <Pattern confidenceLevel="85"
                              proximity="300">
                              <IdMatch idRef="MRN"/>
                              <Match idRef="30 AccountNrs"
                                    minCount="30"
                                    proximity="3000"
                                    uniqueResults="true"/>
                  </Pattern>
      </Entity>
      <Regex id="30 AccountNrs">\d{5}</Regex>

Em alguns casos, poderá ter de identificar determinados números de identificação de contas ou registos que, por razões históricas, não seguem um padrão padronizado. Por exemplo, Medical Record Numbers pode ser composto por muitas permutações diferentes de letras e números na mesma organização. Apesar de, no início, poder ser difícil identificar um padrão, uma inspeção mais detalhada permite-lhe reduzir frequentemente um padrão que descreve todos os valores válidos sem causar um número excessivo de correspondências inválidas. Por exemplo, poderá ser detetado que "todos os MRNs têm, pelo menos, sete carateres de comprimento, têm pelo menos dois dígitos numéricos e, se tiverem letras, começam com um". A criação de uma expressão regular com base nesses critérios deve permitir-lhe minimizar correspondências desnecessárias ao capturar todos os valores pretendidos e uma análise mais aprofundada poderá permitir uma maior precisão ao definir padrões separados que descrevem diferentes formatos.

Criar manualmente um pacote de regras

Este procedimento mostra-lhe como criar um ficheiro no formato XML denominado pacote de regras (com codificação Unicode) e, em seguida, carregá-lo para o Microsoft Purview com cmdlets do PowerShell de Conformidade & de Segurança.

Observação

Se o SIT a que mapeou conseguir detetar provas corroborativas de várias palavras, os elementos secundários que definir num pacote de regras criado manualmente podem ser mapeados para o SIT. Por exemplo, o nome John Smith não corresponderia como um elemento secundário porque comparávamos John e Smith encontrávamos no conteúdo separadamente com o termo John Smith carregado num dos campos, se esse campo de provas corroborativas não estivesse mapeado para um SIT que consiga detetar esse padrão.

Existe um limite de 10 pacotes de regras num inquilino do Microsoft 365. Uma vez que um pacote de regras pode conter um número arbitrário de tipos de informações confidenciais, pode evitar criar um novo pacote de regras sempre que quiser definir um novo SIT com este método, exportar um pacote de regras existente e adicionar os seus tipos de informações confidenciais ao XML antes de o voltar a carregar.

  1. Crie um pacote de regras no formato XML (com codificação Unicode), semelhante ao exemplo a seguir. (Você pode copiar, modificar e usar nosso exemplo.)

    Quando configurar o pacote de regras, certifique-se de que referencia corretamente os .csv, .tsv ou pipe (|) ficheiro de tabela de origem de informações confidenciais delimitados e edm.xml ficheiro de esquema. Você pode copiar, modificar e usar nosso exemplo. Neste xml de exemplo, os seguintes campos têm de ser personalizados para criar o seu tipo sensível EDM:

    • Id do RulePack e id ExactMatch: Use New-GUID para gerar um GUID.

    • Datastore: este campo especifica o repositório de dados de pesquisa EDM a ser usado. Fornece o nome da origem de dados do Esquema EDM configurado.

    • idMatch: este campo aponta para o elemento principal do EDM.

    • Correspondências: especifica o campo a ser utilizado na pesquisa exata. Forneça um nome de campo pesquisável no esquema EDM para o DataStore.

    • Classificação: este campo especifica a correspondência SIT que aciona a pesquisa EDM. Pode utilizar o nome ou GUID de um SIT incorporado ou personalizado existente.

    Observação

    Tenha em atenção que qualquer cadeia que corresponda ao SIT fornecido será hash e comparada com todas as entradas na tabela de origem de informações confidenciais. Para evitar problemas de desempenho se escolher um SIT personalizado para o elemento de classificação, não utilize um que corresponda a uma grande percentagem de conteúdo. Por exemplo, uma que corresponda a "qualquer número" ou "qualquer palavra de cinco letras". Pode diferenciá-la ao adicionar palavras-chave de suporte ou incluir formatação na definição da classificação personalizada SIT.

    • Correspondência: este campo aponta para provas adicionais encontradas nas proximidades de idMatch.

    • Correspondências: fornece qualquer nome de campo no Esquema EDM para o DataStore.

    • IdRef de recurso: Esta secção especifica o nome e a descrição do tipo confidencial em várias regiões

      • Fornece o GUID para o ID ExactMatch.
      • Nome & descrição: personalize conforme necessário.
      <RulePackage xmlns="http://schemas.microsoft.com/office/2018/edm">
         <RulePack id="fd098e03-1796-41a5-8ab6-198c93c62b11">
           <Version build="0" major="2" minor="0" revision="0" />
           <Publisher id="eb553734-8306-44b4-9ad5-c388ad970528" />
           <Details defaultLangCode="en-us">
             <LocalizedDetails langcode="en-us">
               <PublisherName>IP DLP</PublisherName>
               <Name>Health Care EDM Rulepack</Name>
               <Description>This rule package contains the EDM sensitive type for health care sensitive types.</Description>
             </LocalizedDetails>
           </Details>
         </RulePack>
         <Rules>
           <ExactMatch id = "E1CC861E-3FE9-4A58-82DF-4BD259EAB371" patternsProximity = "300" dataStore ="PatientRecords" recommendedConfidence = "65" >
             <Pattern confidenceLevel="65">
               <idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" />
             </Pattern>
             <Pattern confidenceLevel="75">
               <idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" />
               <Any minMatches ="3" maxMatches ="6">
                 <match matches="PatientID" />
                 <match matches="MRN"/>
                 <match matches="FirstName"/>
                 <match matches="LastName"/>
                 <match matches="Phone"/>
                 <match matches="DOB"/>
               </Any>
             </Pattern>
           </ExactMatch>
           <LocalizedStrings>
             <Resource idRef="E1CC861E-3FE9-4A58-82DF-4BD259EAB371">
               <Name default="true" langcode="en-us">Patient SSN Exact Match.</Name>
               <Description default="true" langcode="en-us">EDM Sensitive type for detecting Patient SSN.</Description>
             </Resource>
           </LocalizedStrings>
         </Rules>
      </RulePackage>
      
  2. Carregue o pacote de regras ao executar o seguinte comando do PowerShell:

    New-DlpSensitiveInformationTypeRulePackage -FileData ([System.IO.File]::ReadAllBytes('.\\rulepack.xml'))
    

Observação

A sintaxe do ficheiro do pacote de regras é igual à de outros tipos de informações confidenciais. Para obter detalhes completos sobre a sintaxe do ficheiro do pacote de regras e para opções de configuração adicionais e para obter instruções sobre como modificar e eliminar tipos de informações confidenciais com o PowerShell, crie um SIT personalizado com o PowerShell.

Próxima etapa