Создание схемы и пакета правил EDM SIT (новый интерфейс)
Вы можете создать схему точного соответствия данных (EDM) и тип конфиденциальной информации EDM (SIT) в новом интерфейсе с помощью одного рабочего процесса на портале соответствия требованиям Microsoft Purview.
Совет
Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас в центре пробных версий Microsoft Purview. Сведения о регистрации и условиях пробной версии.
Сфера применения
- Новый интерфейс
Если вы хотите создать EDM SIT с помощью классического интерфейса, см. статью Создание EDM SIT (классический интерфейс). Если вам нужна помощь по выбору используемого интерфейса, см. статью Выбор правильного интерфейса создания EDM SIT для вас.
Подготовка к работе
Перед началом процедур, описанных в этой статье, обязательно выполните действия, описанные в следующих статьях.
- Экспорт исходных данных для точного сопоставления типов конфиденциальной информации на основе данных
- Создание примера файла EDM SIT (новый интерфейс)
Если вы не знакомы с SIT на основе EDM или их реализацией, важно ознакомиться с основными понятиями, приведенными в следующих статьях:
- Сведения о типах конфиденциальной информации
- Подробнее о пользовательских типах конфиденциальной информации с точным совпадением данных
- Сведения о сопоставлении с несколькими токенами
- Начало работы с пользовательскими типами конфиденциальной информации с точным соответствием данных
- Создание точного соответствия данных SIT (новый интерфейс)
- Определения объектов типов конфиденциальной информации
Разрешения
Для создания, тестирования и развертывания пользовательского типа конфиденциальной информации на портале соответствия необходимо иметь разрешения глобального администратора или администратора соответствия требованиям . Дополнительные сведения о ролях и разрешениях см. в разделе Сведения о ролях администратора в Office 365.
Важные факторы
Ниже приведено несколько важных моментов, которые следует учитывать при создании схемы EDM и siT на основе EDM.
Прежде чем выбирать основные элементы, просмотрите встроенные sit , чтобы получить представление о том, какие из них лучше всего соответствуют вашим потребностям.
Для каждого EDM SIT необходимо выбрать по крайней мере один первичный элемент и не более 10 первичных элементов. Если у вас есть поле короборативных данных с несколькими токенами, выберите один из следующих параметров:
- Выберите Сопоставление с несколькими токенами.
- Сопоставьте элементы в полях с несколькими токенами с sit, который может обнаружить это содержимое. (Чем больше полей с уникальными значениями вы сопоставляете, тем точнее будет EDM SIT. Сопоставление нескольких полей также помогает повысить производительность, снизить нагрузку на обработку и избежать превышения времени ожидания системы.)
При выборе основных элементов для SIT выберите поля, которые гарантируют уникальность каждой строки в таблице данных. Например, не используйте такие поля, как
FirstName
илиDateOfBirth
. Почему? Поскольку имена и даты рождения, скорее всего, будут дублироваться в таблице конфиденциальных данных. Вместо этого используйте поля с уникальными значениями, напримерSocialSecurityNumber
илиBankAccountNumber
.Рекомендация: Создайте схему EDM из примера файла данных. Следуя этой рекомендации, убедитесь, что образец файла данных соответствует следующим требованиям:
- Данные должны быть упорядочены в виде таблицы со столбцами и строками. Используйте имена полей для заголовков столбцов. (Строки в таблице соответствуют отдельным элементам данных.)
- Имена полей могут содержать только буквенно-цифровые символы.
- Имена полей должны начинаться с буквы и состоять по крайней мере из трех буквенно-цифровых символов.
- Если эти требования к именованию не выполнены, при отправке примера файла данных могут возникнуть ошибки.
Если вы используете пример файла конфиденциальной информации для настройки EDM SIT, система предлагает существующий SIT для каждого поля, которое лучше всего обнаруживает отправленные данные, если такой SIT доступен. Microsoft Purview по умолчанию использует сопоставление с одним маркером для обнаружения конфиденциального содержимого. Таким образом, если существующие SIT не могут обнаружить данные для поля в схеме EDM, применяется режим сопоставления с одним маркером. Очень важно убедиться , что функция SIT, предлагаемая для каждого элемента, обнаружит точную строку, которую требуется отслеживать:
- Убедитесь, что предлагаемый sit не содержит окружающих символов, которые отличаются от содержимого, которое вы хотите обнаружить.
- Убедитесь, что предлагаемый sit не исключает ни одну допустимую часть строки, хранящуюся в таблице конфиденциальной информации.
- Убедитесь, что используемый параметр SIT точно соответствует формату данных, которые требуется обнаружить. Например, найдите что-то вроде
Nine digits with optional hyphens or spaces
, а не простоdigits
, или проверка дляA combination of 32 characters consisting of letters and digits
, а не простоtext strings
.
Использование sit, которые точно соответствуют формату данных, которые вы пытаетесь обнаружить, является еще одним способом повысить точность результатов и сократить время, необходимое для завершения сопоставления.
Примечание.
Все данные сохраняются при переходе вперед (Далее) и назад (Назад) через инструмент при выборе. Обратная навигация поддерживает только переход со страницы верхнего уровня на страницу верхнего уровня и с подстраничной страницы на вложенную страницу. Вы не можете переходить назад со страницы верхнего уровня на предыдущую или с подстраничной страницы на предыдущую страницу верхнего уровня.
Создание схемы EDM и SIT
Следующая процедура содержит пошаговые инструкции по созданию схемы EDM и SIT с помощью нового интерфейса. Концептуальный обзор и схема процесса в целом см. в статье Обзор рабочего процесса EDM (новый интерфейс).
Инструкции
На портале соответствия для клиента перейдите враздел Классификаторы EDM классификации>данных.
Убедитесь, что для переключателя Новый интерфейс EDM установлено значение Включено.
Выберите + Создать классификатор EDM.
Назовите SIT и добавьте описание. Система использует это имя, добавленное к слову schema, для связанной схемы, создаваемой ею.
Нажмите кнопку Далее.
Выберите метод, который вы хотите использовать для схемы: отправьте файл, содержащий пример данных, или определите структуру данных вручную. (Рекомендуется отправить пример файла данных. В остальной части этой процедуры этот параметр предполагается.)
В любом случае вам потребуется информация, описанная в разделе Создание примера EDM SIT (новый интерфейс) для примера файла.Нажмите кнопку Далее.
Выберите пример файла и нажмите кнопку Отправить файл. Нажмите кнопку Далее.
(Если во время отправки отображаются ошибки, укажите их и повторите попытку.)На странице Выбор основных элементов :
- В столбце Основной элемент выберите основной элемент. Каждый основной элемент должен быть сопоставлен с SIT. Рекомендуется выбрать поля, в котором отображается полное совпадение , в столбце Проверка соответствия .
- В столбце Режим соответствия для каждого поля укажите, какой из следующих параметров сопоставления следует применить:
- Вариант 1. Ничего не делайте, чтобы принять предложенный системой SIT.
- Вариант 2. Разверните раскрывающееся меню. В разделе Тип конфиденциальной информации (SIT) щелкните значок карандаша (Изменить), а затем выберите другой существующий SIT.
- Вариант 3. В разделе Режим сопоставления выберите Один маркер.
- Вариант 4. В разделе Режим сопоставления выберите Несколько токенов.
Нажмите кнопку Далее.
Настройка параметров для данных в выбранных столбцах.
- Переключатель Использовать одни и те же параметры для всех столбцов по умолчанию имеет значение Вкл . Если вы хотите использовать отдельные параметры для каждого поля данных, установите переключатель в значение Выкл.
- Параметр Данные в столбцах без учета регистра выбран по умолчанию. Чтобы применить обнаружение с учетом регистра , снимите этот флажок.
- При необходимости выберите параметр Игнорировать разделители и знаки препинания для данных во всех столбцах . Затем можно либо выбрать разделители и знаки препинания, которые нужно игнорировать, из списка, либо ввести пользовательские разделители и знаки препинания, которые следует игнорировать.
Важно!
Если выбран параметр Игнорировать разделители для столбца первичного элемента в схеме, убедитесь, что сопоставленный ему SIT предназначен для сопоставления данных как с выбранными разделителями, так и без него.
- Choose Submit.
После завершения EDM автоматически создает одно правило обнаружения для каждого из основных элементов, которые вы определили. Он также создает правило высокой достоверности и правило средней достоверности . Правила высокой достоверности имеют больше требований, чем правила средней достоверности, которые, в свою очередь, имеют больше требований, чем правила низкой достоверности. (Правила низкой достоверности должны создаваться вручную.) Эти правила можно просмотреть и изменить на странице Настройка правил обнаружения для первичных элементов .
Совет
Те элементы, которые не выбраны в качестве первичных, по-прежнему могут использоваться в качестве подтверждающих (вспомогательных) доказательств. Чем больше вспомогательных элементов, которые находятся в определенной близости к первичным элементам, тем выше уверенность в том, что совпадение является истинным положительным.
Рекомендации
Подождите по крайней мере один час после создания или редактирования схемы, прежде чем скачивать и использовать ее для отправки данных EDM. Это помогает убедиться, что схема синхронизирована с системой. Если схема скачана слишком рано, при попытке загрузить схему через командную строку может отобразиться сообщение об ошибке.
Не используйте агент отправки EDM для скачивания, редактирования и последующей повторной отправки схемы. Это приводит к ошибке, так как с помощью агента отправки EDM для скачивания схемы в схему добавляются теги, которые не проходят проверки создания схемы.
Чтобы убедиться, что обнаружены все подтверждающие доказательства, выполните одно из следующих действий: — Обрезайте поля подтверждения с несколькими токенами до максимального числа маркеров, поддерживаемых функцией с несколькими маркерами (в настоящее время пять маркеров).
— Сопоставьте поле с несколькими токенами с sit, который может полностью обнаружить данные с несколькими токенами. — После создания или редактирования EDM SIT протестируйте его с помощью следующего командлета PowerShell, а затем подождите 24 часа, прежде чем тестировать его в решении политики защиты от потери данных (DLP).
Test-DataClassification -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]”