Analizar el contenido del caso
Cuando el número de documentos recopilados es grande, puede ser difícil revisarlos todos. Microsoft Purview eDiscovery (Premium) proporciona las siguientes herramientas para analizar los documentos:
- Detección de semiduplicados
- Subprocesos de correo electrónico
- Temas
Cada una de estas herramientas se presenta en esta unidad. Estas herramientas ayudan a una organización a:
- reducir el volumen de documentos que se van a revisar sin pérdida de información.
- le ayudan a organizar los documentos de forma coherente.
Antes de que una organización use estas herramientas de análisis de documentos, es posible que desee empezar analizando los datos del conjunto de revisión.
Analizar datos en un conjunto de revisión en eDiscovery (Premium)
Las organizaciones suelen tener grandes volúmenes de documentos y mensajes de correo electrónico que deben revisarse. En esta situación, es posible que quieran empezar analizando rápidamente el cuerpo total de los datos para identificar tendencias o estadísticas clave. Este proceso puede ayudar a la organización a desarrollar una estrategia de revisión. El panel de exhibición de documentos electrónicos (Premium) para conjuntos de revisión se puede usar para analizar rápidamente el contenido.
Ejecución de análisis para un conjunto de revisión
Para analizar los datos de un conjunto de revisión:
- Configure las opciones de análisis para su caso. Para obtener más información, consulte Configurar las opciones de búsqueda y análisis.
- Abra el conjunto de revisión que desea analizar.
- Seleccione Analytics en la barra de menús. En el menú desplegable que aparece, seleccione Ejecutar documento & análisis de correo electrónico.
Una organización puede comprobar el progreso del análisis en la pestaña Trabajos del caso. Una vez completado el análisis, puede:
- Vea el informe de Analytics.
- Ejecute consultas en el conjunto de revisión en las salidas del análisis. Para obtener más información, vea Consultar dentro del conjunto de revisión.
- Vea los documentos relacionados con un documento determinado. Para obtener más información, vea Revisar datos en el conjunto de revisión.
Utilice el filtro de consulta Para revisión
Después de que una organización ejecute análisis para el conjunto de revisión, puede usar una consulta de filtro generada automáticamente que se llama Para revisión. Esta consulta filtra el conjunto de revisiones para excluir los elementos inmateriales, duplicados o sin hilos completos. Este proceso deja a la organización solo con los elementos que son representativos, únicos e hilo completo en el conjunto de revisión.
Para aplicar la consulta de filtro Para revisión a un conjunto de revisiones, seleccione Consultas de filtro guardadas. En la lista desplegable que aparece, seleccione [AutoGen] para revisar.
Esta es la sintaxis de la consulta de filtro Para revisión:
(((FileClass="Email") AND (InclusiveType="InclusiveMinus" OR InclusiveType="Inclusive")) OR ((FileClass="Attachment") AND (UniqueInEmailSet="true")) OR ((FileClass="Document") AND (MarkAsRepresentative="Unique")) OR (FileClass="Conversations"))">">
En la siguiente lista se describe el resultado de la consulta de filtro en términos del contenido que se muestra después de aplicarla al conjunto de revisión.
-
Correo electrónico. Muestra los elementos marcados como Hilo completo o Hilo completo sin un adjunto.
- Hilo completo. Un elemento inclusivo es el mensaje final de un hilo de correo electrónico. Contiene todo el contenido anterior en el hilo de correo electrónico.
- Hilo completo sin un adjunto. Un elemento de hilo completo sin un adjunto contiene uno o varios datos adjuntos asociados al mensaje específico en el hilo de correo electrónico. Un revisor puede usar el valor de hilo completo sin un adjunto para determinar qué mensajes específicos del hilo de correo electrónico tienen datos adjuntos asociados.
- Adjuntos, Filtra los datos adjuntos duplicados en el mismo conjunto de correo electrónico. Solo se muestran los datos adjuntos que son únicos en un hilo de correo electrónico.
- Documentos y otros. Filtra los documentos duplicados. Solo se muestran los documentos que son únicos en el conjunto de revisiones.
- Conversaciones de Teams. Se muestran todas las conversaciones de Teams (y Viva Engage) del conjunto de revisión.
Para obtener más información sobre los tipos de hilo completo y la unicidad de los documentos, consulte la sección sobre hilos de correo electrónico que aparece más adelante en esta unidad.
Informe de Analytics
Para ver el informe de Analytics de un conjunto de revisiones:
- Abra el conjunto de revisión.
- Seleccione Analytics en la barra de menús. En el menú desplegable que aparece, seleccione Mostrar informes.
Como resultado del análisis, el informe de Analytics tiene siete componentes:
- Población objetivo. Número de mensajes de correo electrónico, datos adjuntos y documentos dinámicos que se encuentran en el conjunto de revisión.
-
Documentos (excluyendo los anexos). El número de documentos dinámicos que son:
- Documentos principales
- Casi duplicados únicos de un documento principal
- Un duplicado exacto de otro documento
-
Correos electrónicos. Número de mensajes de correo electrónico marcados como:
- Hilo completo
- Copia de hilo completo
- Hilo completo sin un adjunto
- Ninguna de las respuestas anteriores.
-
Adjuntos, Número de datos adjuntos de correo electrónico que son:
- Única
- Duplicados de otros datos adjuntos de correo electrónico en el conjunto de revisión
- Número de documentos por tipo de archivo. Número de archivos, identificados por la extensión de archivo.
- Documentos por origen. Resumen del contenido por su origen de datos original.
- Documentos agregados por proceso. Un resumen del contenido por procesos de conjunto de revisión.
Herramienta de análisis de documentos: detección de casi duplicados en eDiscovery (Premium)
Piense en un conjunto de documentos para revisar en el que un subconjunto se basa en la misma plantilla y tiene en su mayor parte el mismo lenguaje repetitivo, con algunas diferencias aquí y allá. Si un revisor pudiera identificar este subconjunto, revisar uno de los documentos exhaustivamente y revisar las diferencias para el resto, no habría perdido ninguna información única. También habría llevado al revisor solo una fracción del tiempo que le habría llevado leer todos los documentos de principio a fin.
Nota:
La detección de casi duplicados agrupa documentos textualmente similares para ayudar a una organización a hacer más eficiente su proceso de revisión.
¿Cómo funciona la detección de duplicados?
Cuando se ejecuta la detección de casi duplicados, el sistema analiza cada documento con texto. Luego, compara cada documento entre sí para determinar si su similitud es mayor que el umbral establecido. Si es así, los documentos se agrupan juntos.
Una vez que todos los documentos se han comparado y agrupado, se marca un documento de cada grupo como documento principal. Cuando una organización revisa sus documentos, puede revisar primero un documento principal. Después, puede revisar los demás documentos del mismo conjunto casi duplicado. La organización puede centrarse en la diferencia entre el documento principal y el documento que está en revisión.
Herramienta de análisis de documentos: hilos de correo electrónico en eDiscovery (Premium)
Considere una conversación de correo electrónico que ha estado en marcha durante un tiempo. En la mayoría de los casos, el último mensaje del hilo de correo electrónico incluirá el contenido de todos los mensajes anteriores. Por lo tanto, revisar el último mensaje proporciona un contexto completo de la conversación que tuvo lugar en el hilo.
Nota:
El subproceso de correo electrónico identifica estos mensajes para que los revisores puedan revisar una fracción de los documentos recopilados sin perder ningún contexto.
¿Cómo funciona el hilo de correo electrónico?
El hilo de correo electrónico analiza cada hilo de correo electrónico. A continuación, lo deconstruye en mensajes individuales. Cada hilo de correo electrónico es una cadena de mensajes individuales.
Microsoft Purview eDiscovery (Premium) analiza todos los mensajes de correo electrónico del conjunto de revisión para determinar si un mensaje de correo electrónico tiene contenido único. También puede determinar si la cadena (mensajes primarios) está contenida totalmente en el mensaje final del hilo de correo electrónico. Al final del proceso, los mensajes de correo electrónico se dividen en cuatro categorías:
- Hilo completo. Un correo electrónico de hilo completo es el mensaje de correo electrónico final en un hilo de correo electrónico. Contiene todo el contenido anterior de ese hilo de correo electrónico.
- Hilo completo sin un adjunto. Un mensaje de correo electrónico se designa como hilo completo sin un adjunto si hay uno o más archivos adjuntos asociados con el mensaje específico dentro del hilo de correo electrónico. Un revisor puede usar el valor de hilo completo sin un adjunto para determinar qué mensaje de correo electrónico específico dentro del hilo tiene datos adjuntos asociados.
- Copia de hilo completo. Un mensaje de correo electrónico se considera una copia de hilo completo si es una copia exacta de un mensaje de hilo completo o hilo completo sin un adjunto .
- Ninguno. El valor Ninguno indica que el contenido del mensaje está contenido totalmente en al menos otro mensaje de correo electrónico marcado como Hilo completo o Hilo completo sin un adjunto.
¿En qué se diferencia de las conversaciones en Outlook?
De un vistazo, los hilos de correo electrónico suenan similares a las agrupaciones de conversaciones en Outlook. Sin embargo, hay algunas diferencias importantes. Considere una conversación de correo electrónico que se ha bifurcado en dos conversaciones. Por ejemplo, alguien respondió a un correo electrónico que no es el más reciente de la conversación. Como resultado, los dos últimos correos electrónicos de la conversación tienen contenido único.
Outlook sigue agrupando los correos electrónicos en una sola conversación. ¿Por qué? Porque leer solo el último mensaje puede hacer que se pierda el contexto del penúltimo, que también tiene un contenido único.
Dado que el hilo de correo electrónico analiza cada correo electrónico en componentes individuales y los compara, el hilo de correo electrónico marcaría los dos últimos correos electrónicos como hilo completo. Este proceso garantiza que no se perderá ningún contexto siempre que lea todos los correos electrónicos marcados como hilo completo.
Herramienta de análisis de documentos: temas en eDiscovery (Premium)
¿Cómo se redacta un documento? Suelen empezar con una o varias ideas que quieren transmitir en el documento. A continuación, redactan el documento utilizando palabras acordes con las ideas. Cuanto más frecuente sea una idea, más frecuentes suelen ser las palabras relacionadas con esa idea.
Este proceso también informa sobre cómo los usuarios consumen documentos. Los aspectos importantes que hay que comprender al leer un documento son:
- las ideas que el documento intenta transmitir.
- donde aparecen las ideas.
- cuáles son las relaciones entre las ideas.
Estos elementos pueden ampliarse a la forma en que una persona desea consumir un conjunto de documentos. Quieren ver:
- qué ideas están presentes en los conjuntos.
- qué documentos hablan de esas ideas.
- ver documentos que tratan ideas similares si encuentran un documento concreto de interés.
Nota:
La funcionalidad Temas de eDiscovery (Premium) intenta imitar la forma en que los humanos razonan sobre los documentos. Para ello, analiza los temas que se describen en un conjunto de revisión y asigna un tema a los documentos del conjunto de revisión.
En eDiscovery (Premium), Temas va un paso más allá e identifica el tema dominante en cada documento. El tema dominante es el que aparece con más frecuencia en un documento.
¿Cómo funciona Temas?
La funcionalidad Temas analiza documentos con texto en un conjunto de revisión. Lo hace para analizar los temas comunes que aparecen en todos los documentos del conjunto de revisión.
eDiscovery (Premium) asigna esos temas a los documentos en los que aparecen. También etiqueta cada tema con las palabras usadas en los documentos que son representativos del tema. Dado que un documento puede contener varios tipos de materia, el eDiscovery (Premium) suele asignar varios temas a los documentos. El tema que aparece de forma más destacada en un documento se designa como su tema final.
Comprobación de conocimientos
Elija la mejor respuesta para cada una de las siguientes preguntas.