Обнаружение почти повторяющихся данных в eDiscovery (премиум)
Совет
Обнаружение электронных данных (предварительная версия) теперь доступно на новом портале Microsoft Purview. Дополнительные сведения об использовании нового интерфейса обнаружения электронных данных см. в статье Сведения об обнаружении электронных данных (предварительная версия).
Рассмотрим набор документов на проверку, в котором подмножество основано на одном и том же шаблоне и имеет в основном один и тот же язык шаблона, с некоторыми различиями здесь и там. Если бы рецензент мог определить это подмножество, тщательно изучить один из них и проверить различия для остальных, он бы не пропустил какую-либо уникальную информацию, затрачивая лишь часть времени, которое потребовалось бы им на чтение всех документов для покрытия. При обнаружении почти одинаковых документов текстовые документы группируются вместе, чтобы помочь вам сделать процесс проверки более эффективным.
Совет
Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.
Как это работает?
При запуске обнаружения неполных дубликатов система анализирует каждый документ с текстом. Затем он сравнивает каждый документ друг с другом, чтобы определить, превышает ли их сходство установленный порог. Если это так, документы группируются вместе. После того как все документы были сравнены и сгруппированы, документ из каждой группы помечается как "сводный документ". При просмотре документов можно сначала просмотреть сводный документ и просмотреть другие документы в том же наборе неполных дубликатов, сосредоточившись на разнице между сводным и проверяемым документом.