Создание отпечатка документа
Дактилоскопия документов — это функция Microsoft Purview, которая принимает стандартную форму, которую вы предоставляете, и создает тип конфиденциальной информации (SIT) на основе этой формы. Отпечаток документов упрощает защиту конфиденциальной информации, определяя стандартные формы, которые используются в организации. В этой статье описаны основные понятия создания отпечатков документов и создание отпечатков пальцев документа с помощью пользовательского интерфейса или PowerShell.
Дактилоскопия документов включает следующие преимущества:
- SiT, созданные на основе отпечатков документов, можно использовать в качестве метода обнаружения в политиках защиты от потери данных, доступных для Exchange, SharePoint, OneDrive, Teams и устройств.
- Автоматическая маркировка MIP может использовать отпечатки документов в качестве метода обнаружения в Exchange, SharePoint и OneDrive.
- Функции отпечатков документов можно управлять с помощью пользовательского интерфейса Microsoft Purview.
- Поддерживается частичное сопоставление .
- Поддерживается точное сопоставление .
- Улучшенная точность обнаружения
- Поддержка обнаружения на нескольких языках, в том числе на двухбайтовых языках, таких как китайский, японский и корейский.
Важно!
Если вы являетесь клиентом E5, мы рекомендуем обновить существующие отпечатки пальцев, чтобы воспользоваться полным набором функций отпечатков пальцев документа. Если вы являетесь клиентом E3, мы рекомендуем выполнить обновление до лицензии E5. Если вы не решите этого, вы не сможете изменять существующие отпечатки пальцев или создавать новые после апреля 2023 г.
Базовый сценарий для создания отпечатков документов
Как упоминалось, функция отпечатков документов преобразует стандартную форму информации в тип конфиденциальной информации (SIT), который можно использовать в правилах политик защиты от потери данных. Например, можно создать отпечаток документа на основе пустого шаблона патента, а затем создать политику защиты от потери данных, которая обнаруживает и блокирует все исходящие шаблоны патентов с заполненным конфиденциальным содержимым. При необходимости можно настроить подсказки политики , чтобы уведомлять отправителей о том, что они могут отправлять конфиденциальную информацию и что отправитель должен убедиться, что получатели имеют право на получение патентов. Этот процесс работает с любыми текстовыми формами, используемыми в вашей организации. Другие примеры форм, которые можно отправить:
- Правительственные формы
- Формы соответствия требованиям обязательного медицинского страхования
- Формы сведений о сотрудниках для отделов кадров
- Настраиваемые формы, созданные специально для вашей организации
В идеальном случае у вашей организации уже есть установленная бизнес-практика использования определенных форм для передачи конфиденциальных сведений. Чтобы включить обнаружение, отправьте пустую форму для преобразования в отпечаток документа. Затем настройте соответствующую политику. После выполнения этих действий защита от потери данных обнаруживает все документы в исходящей почте, которые соответствуют отпечатку пальца.
Дополнительные сведения о разработке политики защиты от потери данных см. в статье Разработка политики защиты от потери данных.
Дополнительные сведения о создании и развертывании политики защиты от потери данных см. в статье Создание и развертывание политик защиты от потери данных.
Принцип работы отпечатков документов
Вы знаете, что документы не имеют фактических отпечатков пальцев, но имя помогает объяснить эту функцию. Точно так же, как отпечатки пальцев человека имеют уникальные узоры, часто используемые формы (шаблоны) могут иметь узоры слов, которые являются уникальными для них. Вы можете использовать sit, основанный на этом шаблоне, для обнаружения файлов, созданных с помощью того же шаблона. Именно поэтому при отправке формы или шаблона создается наиболее эффективный тип отпечатка документа. Все, кто заполняет форму, используют один и тот же исходный набор слов, а затем добавляют в документ свои собственные слова. Проверяемые документы не могут быть защищены паролем и должны содержать весь текст из исходной формы.
Шаблон патента содержит пустые поля Название патента, Изобретатели и Описание, а также описания для каждого из этих полей — это шаблон слова. При отправке исходного шаблона патента он находится в одном из поддерживаемых типов файлов и в виде обычного текста. MIcrosoft Purview преобразует этот шаблон слова в отпечаток документа, который представляет собой небольшой XML-файл Юникода, содержащий уникальное хэш-значение, представляющее исходный текст. В качестве меры безопасности исходный документ не сохраняется; Сохраняется только хэш-значение. Исходный документ не может быть восстановлен из хэш-значения. Отпечаток патента представлен в sit, который можно использовать в качестве условия в политике защиты от потери данных.
Например, если вы настроили политику защиты от потери данных, которая запрещает обычным сотрудникам отправлять исходящие сообщения, содержащие патенты, DLP использует отпечаток патента SIT для обнаружения патентов и блокировки этих сообщений электронной почты. Кроме того, вы можете позволить вашему юридическому отделу отправлять патенты другим организациям, так как у него есть бизнес-потребности в этом. Чтобы разрешить определенным отделам отправлять конфиденциальную информацию, создайте исключения для этих отделов в политике защиты от потери данных. Кроме того, можно разрешить им переопределить подсказку политики с бизнес-обоснованием.
Важно!
Текст во внедренных документах не считается для создания отпечатков пальцев. Необходимо предоставить примеры файлов шаблонов, которые не содержат внедренных документов.
Ограничения относительно отпечатков документов
Отпечаток документа не обнаруживает конфиденциальную информацию в следующих случаях:
- Файлы защищены паролем.
- Файлы, содержащие только изображения
- Документы не содержат весь текст из исходной формы, которая использовалась для создания отпечатка документа.
- Файлы размером более 4 МБ
Примечание.
Чтобы использовать отпечаток документов на устройствах, необходимо включить расширенную проверку классификации и защиту .
Отпечатки пальцев хранятся в отдельном пакете правил. Максимальный размер этого пакета правил составляет 150 КБ. Учитывая это ограничение, можно создать около 50 отпечатков пальцев для каждого клиента.
Примечание.
Шаблон, используемый для создания отпечатка пальца, должен содержать не менее 4096 символов. Поддерживаемая длина извлеченного текста для шаблона отпечатка пальца должна составлять от 4 096 до 204 800 символов.
В следующих примерах показано, что происходит при создании отпечатка документа на основе шаблона патента. Однако в качестве основы для создания отпечатка документа можно использовать любую форму.
Пример. Создание патентного документа, соответствующего отпечатку документа шаблона патента
Выберите соответствующую вкладку для используемого портала. В зависимости от плана Microsoft 365 Портал соответствия требованиям Microsoft Purview будет прекращена или будет прекращена в ближайшее время.
Дополнительные сведения о портале Microsoft Purview см. на портале Microsoft Purview. Дополнительные сведения о портале соответствия требованиям см. в разделе Портал соответствия требованиям Microsoft Purview.
- На портале Microsoft Purview перейдите в раздел Защита от потери данных или Information Protection>КлассификаторыТипы конфиденциальной> информации.
- На странице Типы конфиденциальной информации выберите + Создать SIT на основе отпечатков пальцев.
- Введите имя и описание для нового SIT.
- Отправьте файл, который вы хотите использовать в качестве шаблона отпечатков пальцев.
- НЕОБЯЗАТЕЛЬНО. Настройте требования для каждого уровня достоверности. (Дополнительные сведения см. в разделах Частичное сопоставление и Точное сопоставление.)
- Нажмите кнопку Далее.
- Просмотрите параметры и нажмите кнопку Создать.
- Когда откроется страница подтверждения, нажмите кнопку Готово.
PowerShell: пример патентного документа, соответствующего отпечатку документа шаблона патента
>> $Patent_Form = ([System.IO.File]::ReadAllBytes('C:\My Documents\patent.docx'))
>> New-DlpSensitiveInformationType -Name "Patent SIT" -FileData $Patent_Form -ThresholdConfig @{low=40;medium=60;high=80} -IsExact $false -Description "Contoso Patent Template"
Частичное сопоставление
Чтобы настроить частичное сопоставление отпечатка документа, при настройке параметров конфигурации во время отправки шаблона задайте уровень достоверности, выберите Низкий, Средний или Высокий и укажите, сколько текста в файле должно соответствовать отпечатку пальца в процентах от 30% до 90%.
Высокий уровень достоверности возвращает наименьшее количество ложноположительных результатов, но может привести к большему числу ложноотрицательных результатов. Низкие или средние уровни достоверности возвращают больше ложноположительных результатов, но от нескольких до нуля ложноотрицательных.
- низкая достоверность. Совпадаемые элементы содержат наименьшее количество ложноотрицательных значений, но больше всего ложноположительных результатов. Низкая достоверность возвращает все совпадения с низкой, средней и высокой достоверностью.
- средняя достоверность. Совпадаемые элементы содержат среднее количество ложноположительных и ложноотрицательных результатов. Средняя достоверность возвращает все совпадения средней и высокой достоверности.
- высокая достоверность. Совпадаемые элементы содержат наименьшее количество ложноположительных результатов, но больше всего ложноотрицательных.
Точное сопоставление
Чтобы настроить точное сопоставление отпечатка документа, выберите Точный в качестве значения для высокого уровня достоверности. При установке высокого уровня достоверности в значение Точный обнаруживаются только те же файлы, что и отпечаток пальца. Если файл имеет хотя бы небольшое отклонение от отпечатка пальца, он не будет обнаружен.
Уже используете sit отпечатков пальцев?
Существующие отпечатки пальцев и политики и правила для этих отпечатков пальцев должны продолжать работать. Если вы не хотите использовать последние функции отпечатков пальцев, вам не нужно ничего делать.
Если у вас есть лицензия E5 и вы хотите использовать последние функции отпечатков пальцев, у вас есть 2 варианта:
- Создайте новый отпечаток пальца.
- перенос политики на более новую версию.
Примечание.
Создание новых отпечатков пальцев с помощью шаблонов, на которых уже существует отпечаток, не поддерживается.
Создание пользовательского типа конфиденциальной информации на основе отпечатков документов с помощью PowerShell
В настоящее время вы можете создать отпечаток документа только в PowerShell для обеспечения соответствия требованиям безопасности &.
Чтобы создать пользовательский sit на основе отпечатка документа, используйте командлет New-DlpSensitiveInformationType . В следующем примере создается новый отпечаток документа с именем Contoso Customer Confidential на основе файла C:\My Documents\Contoso Customer Form.docx.
$Employee_Form = ([System.IO.File]::ReadAllBytes('C:\My Documents\Contoso Customer Form.docx'))
New-DlpSensitiveInformationType -Name "Contoso Customer Confidential" -FileData $Employee_Form -ThresholdConfig @{low=40;medium=60;high=80} -IsExact $false -Description "Message contains Contoso customer information."
Наконец, добавьте тип конфиденциальной информации Contoso Customer Confidential в политику защиты от потери данных в Портал соответствия требованиям Microsoft Purview. В этом примере к существующей политике защиты от потери данных добавляется правило с именем ConfidentialPolicy.
New-DlpComplianceRule -Name "ContosoConfidentialRule" -Policy "ConfidentialPolicy" -ContentContainsSensitiveInformation @{Name="Contoso Customer Confidential"} -BlockAccess $True
Вы также можете использовать идентификатор отпечатков пальцев в правилах потока обработки почты в Exchange, как показано в следующем примере. Чтобы выполнить эту команду, сначала необходимо подключиться к Exchange PowerShell. Кроме того, обратите внимание, что для синхронизации SIT с Центром администрирования Exchange требуется время.
New-TransportRule -Name "Notify :External Recipient Contoso confidential" -NotifySender NotifyOnly -Mode Enforce -SentToScope NotInOrganization -MessageContainsDataClassification @{Name=" Contoso Customer Confidential"}
Теперь защита от потери данных может обнаруживать документы, которые соответствуют отпечатку Form.docx документа Contoso.
Сведения о синтаксисе и параметрах см. в разделе:
- New-DlpFingerprint
- New-DlpSensitiveInformationType
- Remove-DlpSensitiveInformationType
- Set-DlpSensitiveInformationType
- Get-DlpSensitiveInformationType
Изменение, проверка или удаление отпечатков пальцев документа
Для этого на портале Microsoft Purview откройте отпечаток SIT, который нужно изменить, протестировать или удалить, и выберите соответствующий значок.
Чтобы сделать это с помощью PowerShell, выполните следующие команды:
Изменение отпечатка документа
>> Set-DlpSensitiveInformationType -Name "Fingerprint SIT" -FileData ([System.IO.File]::ReadAllBytes('C:\My Documents\file1.docx')) -ThresholdConfig @{low=30;medium=50;high=80} -IsExact $false-Description "A friendly Description"
Проверка отпечатка документа
>> $r = Test-DataClassification -TextToClassify "Credit card information Visa: 4485 3647 3952 7352. Patient Identifier or SSN: 452-12-1232"
>> $r.ClassificationResults
Удаление отпечатка документа
>> Remove-DlpSensitiveInformationType "Fingerprint SIT"
Перенос существующего идентификатора sit в с помощью портала Microsoft Purview
- Откройте портал > Microsoft Purview Information Protection> Типы конфиденциальных>сведений.
- Откройте sit, содержащий отпечаток пальца, который требуется перенести.
- Нажмите кнопку Изменить.
- Отправьте тот же файл отпечатков пальцев еще раз.
- Просмотрите параметры отпечатков > пальцев Готово.
Перенос отпечатка пальца с помощью PowerShell
Введите следующую команду:
Set-DlpSensitiveInformationType -Name "Old Fingerprint" -FileData ([System.IO.File]::ReadAllBytes('C:\My Documents\file1.docx')) -ThresholdConfig @{low=30;medium=50;high=80} -IsExact $false-Description "A friendly Description"