Создание примера файла EDM SIT (новый интерфейс)
Создание и обеспечение доступности типа конфиденциальной информации (SIT) на основе точного соответствия данных (EDM) — это многоэтапный процесс. Их можно использовать в политиках защиты от потери данных Microsoft Purview, обнаружении электронных данных и некоторых задачах управления содержимым.
Совет
Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас в центре пробных версий Microsoft Purview. Сведения о регистрации и условиях пробной версии.
Сфера применения
- Новый интерфейс
Если вы хотите создать EDM SIT с помощью классического интерфейса, см. статью Создание классического интерфейса EDM SIT.
Подготовка к работе
- Убедитесь, что вы выполнили действия, описанные в разделе Экспорт исходных данных для точного типа конфиденциальной информации на основе данных.
Форматирование примера файла
Система извлекает имена столбцов из примера файла для создания схемы и порекомендует базовые SIT для сопоставления данных образца полей. Он должен быть отформатирован идентично исходному файлу таблицы конфиденциальной информации и содержать искусственные значения, которые представляют фактические данные. Файл можно сохранить в формате.csv (значения, разделенные запятыми), .tsv (значения, разделенные табуляциями) или каналом (|), но он должен совпадать с фактическим файлом таблицы конфиденциальной информации источника. Формат .tsv рекомендуется использовать в тех случаях, когда значения данных включают запятые, например адреса улиц.
- Используйте около 10–20 строк данных, чтобы убедиться, что в системе достаточно примеров для работы.
- Значения полей, содержащие запятые, должны быть заключены в кавычки ".
- Первая строка должна быть строкой заголовка и содержать имена столбцов.
- Файл должен содержать по крайней мере одну строку данных.
- Каждая строка данных должна содержать правильное количество полей, соответствующих заголовкам.
- Пример файла может содержать до 32 столбцов.
- Размер примера файла не может превышать 2,5 МБ.
- Имена столбцов (полей) должны начинаться с буквы, содержать не менее трех символов и состоять только из буквенно-цифровых символов (A–Z, a–z, 0–9) и не могут содержать пробелы, символы подчеркивания или другие специальные символы.
Например, если фактические данные используют формат с разделителями табуляции (.tsv) и выглядят следующим образом:
Затем ваш пример файла должен иметь те же заголовки столбцов, но использовать искусственные значения для строк, как показано ниже.
FirstName | LastName | PatientNumber | CreditCardNumber |
---|---|---|---|
Эрик | Соломон | 987-65-4321 | 9000000000000000 |
Лиза | Тейлор | 123-45-6789 | 500000000000000 |
Андре | Лоусон | 234-56-7890 | 200000000000000 |
Использование примеров шаблонов файлов
Если вы работаете в сфере здравоохранения США, финансовых услуг США или страховой отрасли США, вы можете начать с следующих примеров шаблонов файлов, чтобы ускорить процесс создания примера файлов. Эти файлы содержат наиболее часто используемые заголовки столбцов в соответствующих отраслях, а также искусственные значения в полях.
Чтобы использовать эти шаблоны, выполните следующие действия:
- Скачайте пример шаблона файла для вашей отрасли.
- Сравните заголовки столбцов в шаблоне с фактическими исходными данными и выберите те, которые вы хотите использовать в качестве основных полей в настраиваемом примере файла.
- Сравните форматирование фактических исходных данных с форматированием искусственных значений. Измените форматирование искусственных значений в соответствии с форматированием значений исходных данных.
- Сохраните настроенный пример файла для использования при создании схемы и пакета правил EDM SIT.
Совет
При работе в новом интерфейсе вы можете отправить пример файла или ввести его значения вручную. Рекомендуется создать пример файла.
Следующее действие
- Для новых возможностей: создание схемы и пакета правил EDM SIT