Поделиться через


Настройка встроенных типов конфиденциальных данных

При поиске конфиденциальной информации в содержимом необходимо описать эти данные в правиле. Защита от потери данных Microsoft Purview (DLP) включает правила для наиболее распространенных типов конфиденциальной информации. Эти правила можно использовать сразу. Чтобы использовать их, необходимо включить их в политику. Эти встроенные правила можно настроить в соответствии с конкретными потребностями вашей организации. Это можно сделать, создав пользовательский тип конфиденциальной информации. В этом разделе показано, как настроить XML-файл, содержащий существующую коллекцию правил, чтобы можно было обнаружить более широкий диапазон потенциальных сведений о кредите карта.

Вы можете взять этот пример и применить его к другим встроенным типам конфиденциальной информации. Список типов конфиденциальной информации по умолчанию и определений XML см. в разделе Определения сущностей типов конфиденциальной информации.

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас в центре пробных версий Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Экспорт XML-файла с текущими правилами

Чтобы экспортировать XML, вам необходимо подключиться к Безопасности и соответствию требованиям PowerShell.

  1. В PowerShell введите следующую команду, чтобы отобразить правила вашей организации на экране. Если вы не создавали собственные правила, вы увидите только стандартные, встроенные правила, отмеченные как "Пакет правил Майкрософт".

    Get-DlpSensitiveInformationTypeRulePackage
    
  2. Сохраните правила вашей организации в переменной, введя следующее. Сохранение чего-либо в переменной делает это легко доступным позже в формате, который подходит для команд PowerShell.

    $ruleCollections = Get-DlpSensitiveInformationTypeRulePackage
    
  3. Создайте форматированный XML-файл со всеми данными, введя следующую информацию.

    [System.IO.File]::WriteAllBytes('C:\custompath\exportedRules.xml', $ruleCollections.SerializedClassificationRuleCollection)
    

    Важно!

    Убедитесь, что используется расположение, где фактически хранится пакет правил. C:\custompath\ — это заполнитель.

Найдите правило, которое требуется изменить, в XML.

Приведенные выше командлеты экспортировали всю коллекцию правил, которая включает правила по умолчанию, которые предоставляются корпорацией Майкрософт. Далее необходимо искать специальное правило номера кредитной карты, которое вы хотите изменить.

  1. Откройте в текстовом редакторе XML-файл, экспорт которого показан в предыдущем разделе.

  2. Прокрутите <Rules> вниз до тега, который является началом раздела, содержащего правила защиты от потери данных. Так как этот XML-файл содержит сведения для всей коллекции правил, он содержит другие сведения вверху, которые необходимо прокрутить, чтобы перейти к правилам.

  3. Найдите Func_credit_card с определением правила для номера кредитной карты. В XML имена правил не могут содержать пробелы, поэтому пробелы обычно заменяются символами подчеркивания, а имена правил иногда сокращаются. Примером этого является правило номера социального страхования США, которое является сокращенным SSN. XML-код правила номера кредитных карт должен выглядеть так, как в следующем примере кода:

    <Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085"
           patternsProximity="300" recommendedConfidence="85">
          <Pattern confidenceLevel="85">
           <IdMatch idRef="Func_credit_card" />
            <Any minMatches="1">
              <Match idRef="Keyword_cc_verification" />
              <Match idRef="Keyword_cc_name" />
              <Match idRef="Func_expiration_date" />
            </Any>
          </Pattern>
        </Entity>
    

Теперь, когда вы нашли определение правила номера кредитной карты в XML-коде, вы можете настроить XML-код правила в соответствии со своими потребностями. Дополнительные сведения об определениях XML см. в глоссарии терминов в конце этого раздела.

Изменение XML и создание типа конфиденциальных данных

Во-первых, вам потребуется создать тип конфиденциальных данных, так как напрямую правила по умолчанию не могут быть изменены. С помощью настраиваемых типов конфиденциальных сведений можно выполнять самые разные действия, описанные в разделе Создание настраиваемого типа конфиденциальных сведений в Безопасности и соответствии требованиям PowerShell. Для простоты в этом примере мы удалим подкрепляющее свидетельство и добавим ключевые слова в правило номера кредитной карты.

Все XML-определения правил основаны на следующем шаблоне. Необходимо скопировать и вставить XML-код определения номера кредитной карты в шаблон, изменить некоторые значения (обратите внимание на . . заполнители в следующем примере), а затем отправьте измененный XML-код в качестве нового правила, которое можно использовать в политиках.

<?xml version="1.0" encoding="utf-16"?>
<RulePackage xmlns="https://schemas.microsoft.com/office/2011/mce">
  <RulePack id=". . .">
    <Version major="1" minor="0" build="0" revision="0" />
    <Publisher id=". . ." />
    <Details defaultLangCode=". . .">
      <LocalizedDetails langcode=" . . . ">
         <PublisherName>. . .</PublisherName>
         <Name>. . .</Name>
         <Description>. . .</Description>
      </LocalizedDetails>
    </Details>
  </RulePack>

 <Rules>
   <!-- Paste the Credit Card Number rule definition here.-->
      <LocalizedStrings>
         <Resource idRef=". . .">
           <Name default="true" langcode=" . . . ">. . .</Name>
           <Description default="true" langcode=". . ."> . . .</Description>
         </Resource>
      </LocalizedStrings>
   </Rules>
</RulePackage>

Вы получили код, который похож на следующий XML-фрагмент. Так как пакеты правил и правила идентифицируются по уникальным GUID, необходимо создать два GUID: один для пакета правил и один для замены GUID правила номера кредитной карты. Guid для идентификатора сущности в следующем примере кода является идентификатором GUID для встроенного определения правила, которое необходимо заменить новым. Существует несколько способов создания GUID, но вы можете легко это сделать в PowerShell, введя [guid]::NewGuid().

<?xml version="1.0" encoding="utf-16"?>
<RulePackage xmlns="https://schemas.microsoft.com/office/2011/mce">
  <RulePack id="8aac8390-e99f-4487-8d16-7f0cdee8defc">
    <Version major="1" minor="0" build="0" revision="0" />
    <Publisher id="8d34806e-cd65-4178-ba0e-5d7d712e5b66" />
    <Details defaultLangCode="en">
      <LocalizedDetails langcode="en">
        <PublisherName>Contoso Ltd.</PublisherName>
        <Name>Financial Information</Name>
        <Description>Modified versions of the Microsoft rule package</Description>
      </LocalizedDetails>
    </Details>
  </RulePack>

 <Rules>
    <Entity id="db80b3da-0056-436e-b0ca-1f4cf7080d1f"
       patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_cc_verification" />
          <Match idRef="Keyword_cc_name" />
          <Match idRef="Func_expiration_date" />
        </Any>
      </Pattern>
    </Entity>
      <LocalizedStrings>
         <Resource idRef="db80b3da-0056-436e-b0ca-1f4cf7080d1f">
<!-- This is the GUID for the preceding Credit Card Number entity because the following text is for that Entity. -->
           <Name default="true" langcode="en-us">Modified Credit Card Number</Name>
           <Description default="true" langcode="en-us">Credit Card Number that looks for additional keywords, and another version of Credit Card Number that doesn't require keywords (but has a lower confidence level)</Description>
         </Resource>
      </LocalizedStrings>
   </Rules>
</RulePackage>

Отмена поиска подкрепляющего свидетельства для типа конфиденциальных данных

Теперь у вас есть новый тип конфиденциальной информации, который можно передать в Портал соответствия требованиям Microsoft Purview. Следующий шаг заключается в том, чтобы сделать правило более конкретным. Измените правило так, чтобы оно искало только 16-значное число, которое проходит контрольную сумму, но не требует дополнительных (короборативных) доказательств, таких как ключевые слова. Для этого потребуется удалить часть XML, которая ищет подкрепляющее свидетельство. Подкрепляющие свидетельства помогают сократить число ложных срабатываний. В этом случае рядом с номером карта кредита обычно находятся определенные ключевые слова или дата окончания срока действия. Если удалить такое свидетельство, также следует снизить уровень вероятности нахождения номера кредитной карты, уменьшив значение confidenceLevel, которое в этом примере равно 85.

<Entity id="db80b3da-0056-436e-b0ca-1f4cf7080d1f" patternsProximity="300"
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
      </Pattern>
    </Entity>

Поиск ключевых слов, связанных с вашей организацией

Возможно, вам потребуется подтвердить доказательства, но требуются другие или дополнительные ключевые слова, и, возможно, вы хотите изменить, где искать эти доказательства. Вы можете изменить patternsProximity значение , чтобы развернуть или сжать окно для подтверждения доказательства вокруг 16-значного числа. Чтобы добавить собственные ключевые слова, необходимо определить список ключевое слово и ссылаться на него в правиле. Следующий XML-код добавляет ключевые слова "карта компании" и "Contoso карта", чтобы любое сообщение, содержащее эти фразы в пределах 150 символов от номера карта кредита, было определено как номер карта кредита.

<Rules>
<! -- Modify the patternsProximity to be "150" rather than "300." -->
    <Entity id="db80b3da-0056-436e-b0ca-1f4cf7080d1f" patternsProximity="150" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_cc_verification" />
          <Match idRef="Keyword_cc_name" />
<!-- Add the following XML, which references the keywords at the end of the XML sample. -->
          <Match idRef="My_Additional_Keywords" />
          <Match idRef="Func_expiration_date" />
        </Any>
      </Pattern>
    </Entity>
<!-- Add the following XML, and update the information inside the <Term> tags with the keywords that you want to detect. -->
    <Keyword id="My_Additional_Keywords">
      <Group matchStyle="word">
        <Term caseSensitive="false">company card</Term>
        <Term caseSensitive="false">Contoso card</Term>
      </Group>
    </Keyword>

Отправка правила

Чтобы отправить правило, выполните следующие действия.

  1. Сохраните правило как XML-файл с кодировкой Юникод. Это важно, так как правило в другой кодировке работать не будет.

  2. Подключение к Безопасности и соответствию требованиям PowerShell

  3. В PowerShell введите указанную ниже команду.

    New-DlpSensitiveInformationTypeRulePackage -FileData ([System.IO.File]::ReadAllBytes('C:\custompath\MyNewRulePack.xml'))
    

    Важно!

    Убедитесь, что используется расположение, где фактически хранится пакет правил. C:\custompath\ — это заполнитель.

  4. Для подтверждения введите Y и нажмите клавишу ВВОД.

  5. Проверьте отображаемое имя нового правила и его отправку, введя следующее:

    Get-DlpSensitiveInformationType
    

Чтобы начать использовать новое правило для обнаружения конфиденциальных данных, необходимо добавить правило в политику DLP. Сведения о том, как добавить правило в политику, см. в статье Создание и развертывание политик защиты от потери данных.

Глоссарий с терминами

Это определения терминов, которые используются в этой процедуре.



Термин Определение
Объект Сущности называются типами конфиденциальной информации, такими как кредитные карта номера. У каждой сущности есть уникальный идентификатор GUID. Если скопировать GUID и выполнить его поиск, вы найдете XML-определение правила и его локализованный перевод. Это определение также можно найти, выполнив поиск GUID для перевода, а затем выполнив поиск этого GUID.
Функции XML-файл ссылается на Func_credit_card, который является функцией в скомпилированном коде. Функции используются для выполнения сложных регулярных выражений и проверки соответствия контрольных сумм нашим встроенным правилам. Так как это происходит в коде, некоторые переменные не отображаются в XML-файле.
IdMatch Это идентификатор, с которым должен совпасть шаблон, например, номер кредитной карты.
Списки ключевых слов XML-файл также ссылается на keyword_cc_verification и keyword_cc_name, которые представляют собой списки ключевых слов, которые мы ищем для patternsProximity сущности. В настоящее время они не отображаются в XML-коде.
Шаблон Шаблон содержит список того, что ищет конфиденциальный тип. К ним относятся ключевые слова, регулярные выражения и внутренние функции, выполняющие различные задачи, такие как проверка контрольных сумм. Типы конфиденциальной информации могут иметь несколько шаблонов с уникальными уровнями достоверности. Это полезно при создании типа конфиденциальных данных, который возвращает высокую вероятность, если найдено подкрепляющее свидетельство, и низкий уровень вероятности, если свидетельств мало или они не найдены.
Параметр confidenceLevel шаблона Это уровень вероятности совпадения, определенный модулем DLP. Он связан с совпадением с шаблоном, если заданы соответствующие требования. Это мера достоверности, который следует учитывать при использовании правил потока обработки почты Exchange (также известных как правила транспорта).
patternsProximity Когда мы находим то, что выглядит как кредит карта числовой шаблон, это расстояние вокруг этого числа, patternsProximity где мы будем искать подтверждающие доказательства.
recommendedConfidence Это рекомендуемый для правила уровень вероятности. Рекомендуемый уровень доверия применяется к сущностям и сходствам. Для сущностей это число никогда не вычисляется по отношению confidenceLevel к для шаблона. Это просто дополнительный фактор, помогающий выбрать уровень вероятности. Для сопоставлений значение шаблона должно быть больше, confidenceLevel чем recommendedConfidence число для вызова действия правила потока обработки почты. — recommendedConfidence это уровень доверия по умолчанию, используемый в правилах потока обработки почты, который вызывает действие. При необходимости можно вручную изменить правило потока обработки почты на основе уровня достоверности шаблона.

Дополнительные сведения