Analizzare il contenuto dei casi

Completato

Quando il numero di documenti raccolti è elevato, può essere difficile esaminarli tutti. Microsoft Purview eDiscovery (Premium) offre gli strumenti seguenti per analizzare i documenti:

  • Rilevamento di documenti simili
  • Threading posta elettronica
  • Temi

Ognuno di questi strumenti è stato introdotto in questa unità. Questi strumenti consentono a un'organizzazione di:

  • ridurre il volume dei documenti da esaminare senza alcuna perdita di informazioni.
  • consentono di organizzare i documenti in modo coerente.

Prima che un'organizzazione usi questi strumenti di analisi dei documenti, può iniziare analizzando i dati nell'insieme da rivedere.

Analizzare i dati in un insieme da rivedere in eDiscovery (Premium)

Le organizzazioni hanno spesso grandi volumi di documenti e messaggi di posta elettronica che devono essere esaminati. In questa situazione, è possibile iniziare analizzando rapidamente il corpo totale dei dati per identificare tendenze o statistiche chiave. Questo processo può aiutare l'organizzazione a sviluppare una strategia di revisione. Il dashboard di eDiscovery (Premium) per gli insiemi da rivedere può essere usato per analizzare rapidamente il contenuto.

Eseguire l'analisi per un insieme da rivedere

Per analizzare i dati in un insieme da rivedere:

  1. Configurare le impostazioni di analisi per il caso. Per altre informazioni, vedere Configurare le impostazioni di ricerca e analisi.
  2. Aprire l'insieme da rivedere da analizzare.
  3. Selezionare Analisi sulla barra dei menu. Nel menu a discesa visualizzato selezionare Esegui documento & analisi della posta elettronica.

Un'organizzazione può controllare lo stato di avanzamento dell'analisi nella scheda Processi del caso. Al termine dell'analisi, è possibile:

Usare la query di filtro Da rivedere

Dopo che un'organizzazione esegue l'analisi per l'insieme da rivedere, può usare una query di filtro generata automaticamente chiamata Da rivedere. Questa query filtra l'insieme da rivedere in modo da escludere elementi immateriali, duplicati o non conversazione completa. Questo processo lascia all'organizzazione solo gli elementi rappresentativi, unici e conversazione completa nell'insieme da rivedere.

Per applicare la query di filtro Da rivedere a un insieme da rivedere, selezionare Query filtro salvate. Nell'elenco a discesa visualizzato, selezionare [AutoGen] Da rivedere.

Screenshot di un insieme da rivedere che mostra l'opzione Query filtro salvate e l'opzione Da rivedere nel menu a discesa.

Ecco la sintassi per la query di filtro Da rivedere:


  
   (((FileClass="Email") AND (InclusiveType="InclusiveMinus" OR InclusiveType="Inclusive")) OR ((FileClass="Attachment") AND (UniqueInEmailSet="true")) OR ((FileClass="Document") AND (MarkAsRepresentative="Unique")) OR (FileClass="Conversations"))">">
  

L'elenco seguente descrive il risultato della query di filtro in termini di contenuto visualizzato dopo l'applicazione all'insieme da rivedere.

  • Indirizzo di posta elettronica. Visualizza gli elementi contrassegnati come Conversazione completa o Conversazione completa senza allegati.
    • Conversazione completa. Un elemento di conversazione completa è il messaggio finale in un thread di posta elettronica. Contiene tutto il contenuto precedente nel thread di messaggi di posta elettronica.
    • Conversazione completa senza allegati. Un elemento conversazione completa senza allegati contiene uno o più allegati associati al messaggio specifico nel thread di messaggi di posta elettronica. Un revisore può usare il valore conversazione completa senza allegati per determinare quali messaggi specifici hanno allegati associati nel thread di messaggi di posta elettronica.
  • Allegati. Filtra gli allegati duplicati nello stesso insieme di posta elettronica. Vengono visualizzati solo gli allegati unici in un thread di messaggi di posta elettronica.
  • Documenti e altro. Filtra i documenti duplicati. Vengono visualizzati solo i documenti unici nell'insieme da rivedere.
  • Conversazioni di Teams. Vengono visualizzate tutte le conversazioni di Teams (e Viva Engage) nel set di revisioni.

Per altre informazioni sui tipi di conversazione completa e sull'unicità dei documenti, vedere la sezione sul threading della posta elettronica visualizzata più avanti in questa unità.

Report di analisi

Per visualizzare il report di analisi per un insieme da rivedere:

  1. Aprire l'insieme da rivedere.
  2. Selezionare Analisi sulla barra dei menu. Nel menu a discesa visualizzato, selezionare Mostra report.

Come risultato dell'analisi, il report di analisi include sette componenti:

  • Popolazione di destinazione. Numero di messaggi di posta elettronica, allegati e documenti separati trovati nell'insieme da rivedere.
  • Documenti (esclusi gli allegati). Numero di documenti separati che sono:
    • Documenti principali
    • Documenti simili unici di un documento principale
    • Un duplicato identico di un altro documento
  • Messaggi di posta elettronica. Numero di messaggi di posta elettronica contrassegnati come:
    • Conversazione completa
    • Copia di conversazione completa
    • Conversazione completa senza allegati
    • Nessuna delle precedenti
  • Allegati. Numero di allegati di posta elettronica che sono:
    • Unici
    • Duplicati di un altro allegato di posta elettronica nell'insieme da rivedere
  • Numero di documenti per tipo di file. Numero di file, identificati dall'estensione di file.
  • Documenti per origine. Riepilogo del contenuto in base all'origine dati originale.
  • Documenti aggregati per processo. Riepilogo del contenuto in base ai processi dell'insieme da rivedere.

Strumento di analisi dei documenti: rilevamento documento simile in eDiscovery (Premium)

Si consideri un insieme di documenti da rivedere in cui un sottoinsieme si basa sullo stesso modello e ha per lo più lo stesso linguaggio boilerplate, con alcune differenze presenti. Se un revisore potesse identificare questo sottoinsieme, esaminare accuratamente uno dei documenti ed esaminare le differenze per il resto, non avrebbe perso informazioni uniche. Inoltre, il revisore avrebbe impiegato solo una frazione del tempo necessario per leggere tutti i documenti da rivedere.

Nota

Il rilevamento di documenti simili raggruppa documenti testualmente simili per aiutare un'organizzazione a rendere più efficiente il processo di revisione.

Come funziona il rilevamento dei duplicati?

Quando viene eseguito il rilevamento di documenti simili, il sistema analizza ogni documento con testo. Confronta quindi ogni documento con gli altri per determinare se la similarità è maggiore della soglia impostata. Se è questo il caso, i documenti vengono raggruppati.

Dopo aver confrontato e raggruppato tutti i documenti, un documento di ogni gruppo viene contrassegnato come Documento principale. Quando un'organizzazione esamina i propri documenti, può esaminare prima un documento principale. Può quindi esaminare gli altri documenti nello stesso insieme di documenti simili. L'organizzazione può concentrarsi sulla differenza tra il documento principalepivot e il documento in revisione.

Strumento di analisi dei documenti: threading della posta elettronica in eDiscovery (Premium)

Si consideri una conversazione di posta elettronica in corso da un po' di tempo. Nella maggior parte dei casi, l'ultimo messaggio nel thread di messaggi di posta elettronica includerà il contenuto di tutti i messaggi precedenti. Pertanto, la revisione dell'ultimo messaggio fornisce un contesto completo della conversazione che si è verificata nel thread.

Nota

Il threading di posta elettronica identifica tali messaggi in modo che i revisori possano esaminare una frazione dei documenti raccolti senza perdere alcun contesto.

Come funziona il threading della posta elettronica?

Il threading di posta elettronica analizza ogni thread di messaggi di posta elettronica. Quindi, lo decostruisce in singoli messaggi. Ogni thread di messaggi di posta elettronica è una catena di singoli messaggi.

Microsoft Purview eDiscovery (Premium) analizza tutti i messaggi di posta elettronica nell'insieme da rivedere per determinare se un messaggio di posta elettronica contiene contenuto unico. Può anche determinare se la catena (messaggi padre) è interamente contenuta nel messaggio finale nel thread di messaggi di posta elettronica. Al termine del processo, i messaggi di posta elettronica sono suddivisi in quattro categorie:

  • Conversazione completa. Un messaggio di posta elettronica conversazione completa è il messaggio di posta elettronica finale in un thread di messaggi di posta elettronica. Contiene tutto il contenuto precedente del thread di posta elettronica.
  • Conversazione completa senza allegati. Un messaggio di posta elettronica viene designato come conversazione completa senza allegati se sono presenti uno o più allegati associati al messaggio specifico all'interno del thread di messaggi di posta elettronica. Un revisore può usare il valore conversazione completa senza allegati per determinare quale messaggio di posta elettronica specifico ha allegati associati nel thread.
  • Copia di copiare. Un messaggio di posta elettronica viene considerato una copia di conversazione completa se è una copia esatta di un messaggio conversazione completa o conversazione completa senza allegati.
  • Nessuno. Il valore Nessuno indica che il contenuto del messaggio è interamente contenuto in almeno un altro messaggio di posta elettronica contrassegnato come conversazione completa o conversazione completa senza allegati.

Qual è la differenza rispetto alle conversazioni in Outlook?

A colpo d'occhio, il threading della posta elettronica sembra simile ai raggruppamenti di conversazioni in Outlook. Esistono tuttavia alcune importanti differenze. Si consideri una conversazione di posta elettronica che è stata duplicata in due conversazioni. Ad esempio, qualcuno ha risposto a un messaggio di posta elettronica non più recente della conversazione. Di conseguenza, gli ultimi due messaggi di posta elettronica nella conversazione hanno entrambi contenuto unico.

Outlook raggruppa ancora i messaggi di posta elettronica in un'unica conversazione. Perché? Poiché la sola lettura dell'ultimo messaggio di posta elettronica potrebbe causare la mancanza del contesto del messaggio di posta elettronica dal secondo all'ultimo, che contiene anche contenuto unico.

Poiché il threading della posta elettronica analizza ogni messaggio di posta elettronica in singoli componenti e li confronta, il threading della posta elettronica contrassegna entrambi gli ultimi due messaggi come conversazione completa. Questo processo garantisce che non si perda alcun contesto, purché si leggano tutti i messaggi contrassegnati come conversazione completa.

Strumento di analisi dei documenti: temi in eDiscovery (Premium)

In che modo una persona scrive un documento? In genere, iniziano con una o più idee che vogliono comunicare nel documento. Compongono quindi il documento usando parole in linea con le loro idee. Quanto più un'idea è diffusa, tanto più frequenti sono le parole correlate a quell'idea.

Questo processo informa anche il modo in cui gli utenti utilizzano i documenti. Gli aspetti importanti da comprendere leggendo un documento sono:

  • le idee che il documento sta cercando di trasmettere.
  • dove vengono visualizzate le idee.
  • quali sono le relazioni tra le idee.

Questi elementi possono essere estesi al modo in cui una persona vuole utilizzare un insieme di documenti. Vogliono vedere:

  • quali idee sono presenti negli insiemi.
  • quali documenti parlano di queste idee.
  • vedere documenti che discutono idee simili se trovano un particolare documento di interesse.

Nota

La funzionalità Temi in eDiscovery (Premium) cerca di imitare il modo in cui gli esseri umani ragionano sui documenti. A tale scopo, analizza i temi discussi in un insieme da rivedere e assegna un tema ai documenti nell'insieme da rivedere.

In eDiscovery (Premium), i temi vanno oltre e identificano il tema dominante in ogni documento. Il tema dominante è quello che viene visualizzato più spesso in un documento.

Come funzionano i temi?

La funzionalità Temi analizza i documenti con testo in un insieme da rivedere. In questo modo, vengono analizzati i temi comuni visualizzati in tutti i documenti nell'insieme da rivedere.

eDiscovery (Premium) assegna i temi ai documenti in cui sono visualizzati. Ogni tema viene inoltre etichettato con le parole utilizzate nei documenti che ne sono rappresentativi. Poiché un documento può contenere vari tipi di argomenti, eDiscovery (Premium) assegna spesso più temi ai documenti. Il tema che compare principalmente in un documento viene designato come tema dominante.

Verifica delle conoscenze

Scegliere la risposta migliore per ognuna delle domande seguenti.

Verificare le conoscenze

1.

Il threading della posta elettronica analizza ogni messaggio di posta elettronica e lo decostruisce fino ai singoli messaggi. Analizza quindi tutti i messaggi di posta elettronica nel working set per determinare se un messaggio ha contenuto unico o se la catena è interamente contenuta in un altro messaggio di posta elettronica. Al termine del processo, i messaggi di posta elettronica sono suddivisi in quattro categorie. In quale categoria l'ultimo messaggio nel messaggio di posta elettronica ha contenuto unico, ma il messaggio non contiene alcuni degli allegati inclusi in altri messaggi di posta elettronica di cui il contenuto è interamente presente in questo messaggio di posta elettronica?