Compartilhar via


Deteção quase duplicada na Deteção de Dados Eletrónicos (Premium)

Importante

Este artigo aplica-se apenas à experiência de Deteção de Dados Eletrónicos clássica. A experiência de Deteção de Dados Eletrónicos clássica será descontinuada em agosto de 2025 e não estará disponível como opção de experiência no portal do Microsoft Purview após a descontinuação.

Recomendamos que comece a planear esta transição mais cedo e comece a utilizar a nova experiência de Deteção de Dados Eletrónicos no portal do Microsoft Purview. Para saber mais sobre como utilizar as funcionalidades e funcionalidades de Deteção de Dados Eletrónicos mais atuais, veja Saiba mais sobre a Deteção de Dados Eletrónicos.

Considere um conjunto de documentos a serem revisados no qual um subconjunto é baseado no mesmo modelo e tem basicamente a mesma linguagem clichê, com algumas diferenças aqui e ali. Se um revisor pudesse identificar este subconjunto, rever um deles cuidadosamente e rever as diferenças para o resto, não teria perdido nenhuma informação exclusiva enquanto demorava apenas uma fração de tempo que os levaria a ler todos os documentos cobertos. Detecção de duplicata próxima agrupa documentos textualmente similares para deixar seu processo de avaliação mais eficiente.

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Como funciona?

Quando a detecção de duplicatas próximas é executada, o sistema analisa cada documento com texto. Depois, ela compara os documento entre si para determinar se suas semelhanças são maiores que o limite definido. Se forem maiores, os documentos são agrupados. Depois de todos os documentos serem comparados e agrupados, um documento de cada grupo é marcado como o “original”. Ao analisar seus documentos, você pode analisar primeiro o original e analisar os outros documentos no mesmo conjunto de duplicatas próximas, focando na diferença entre o original e o documento que está sendo analisado.