Analysieren von Fallinhalten
Wenn die Anzahl der gesammelten Dokumente groß ist, kann es schwierig sein, sie alle zu überprüfen. Microsoft Purview eDiscovery (Premium) bietet die folgenden Tools zum Analysieren der Dokumente:
- Erkennen von Quasiduplikaten
- E-Mail-Threading
- Designs
Jedes dieser Tools wird in dieser Lerneinheit eingeführt. Diese Tools unterstützen eine Organisation dabei, Folgendes zu ermöglichen:
- Das Volumen der zu überprüfenden Dokumente ohne Informationsverlust zu reduzieren.
- Ihnen helfen, die Dokumente auf kohärente Weise zu organisieren.
Bevor eine Organisation diese Dokumentanalysetools verwendet, kann es ratsam sein, mit der Analyse der Daten im Prüfdateisatz zu beginnen.
Analysieren von Daten in einem Prüfdateisatz in eDiscovery (Premium)
Organisationen verfügen häufig über große Mengen von Dokumenten und E-Mail-Nachrichten, die überprüft werden müssen. In dieser Situation kann es ratsam sein, zunächst schnell den gesamten Datentext zu analysieren, um Trends oder wichtige Statistiken zu identifizieren. Dieser Prozess kann die Organisation bei der Entwicklung einer Überprüfungsstrategie unterstützen. Das eDiscovery (Premium)-Dashboard für Prüfdateisätze kann verwendet werden, um den Inhalt schnell zu analysieren.
Ausführen von Analysen für einen Prüfdateisatz
Analysieren von Daten in einem Prüfdateisatz:
- Konfigurieren Sie Analyseeinstellungen für Ihren Fall. Weitere Informationen finden Sie unter Konfigurieren von Such- und Analyseeinstellungen.
- Öffnen Sie den Prüfdateisatz, den Sie analysieren möchten.
- Wählen Sie in der Menüleiste Analysen aus. Wählen Sie im daraufhin angezeigten Dropdownmenü Dokument ausführen & E-Mail-Analyse aus.
Eine Organisation kann den Fortschritt der Analyse auf der Registerkarte Aufträge des Falls überprüfen. Nach Abschluss der Analyse kann folgende Aktionen ausgeführt werden:
- Analysebericht anzeigen.
- Abfragen in Ihrem Prüfdateisatz für Ausgaben der Analyse ausführen. Weitere Informationen finden Sie unter Abfrage in Ihrem Prüfdateisatz.
- Zeigen Sie die Dokumente an, die sich auf ein bestimmtes Dokument beziehen. Weitere Informationen finden Sie unter Überprüfen von Daten im Prüfdateisatz.
Verwenden der Filterabfrage "Zur Überprüfung"
Nachdem eine Organisation Analysen für den Prüfdateisatz ausgeführt hat, kann sie eine automatisch generierte Filterabfrage verwenden, die als Zur Überprüfung bezeichnet wird. Diese Abfrage filtert den Prüfdateisatz, um immateriale, doppelte oder nicht inklusive Elemente auszuschließen. Bei diesem Prozess bleibt der Organisation nur die Elemente, die repräsentativ, eindeutig und inklusiv im Prüfdateisatz sind.
Wählen Sie Gespeicherte Filterabfragen aus, um die Filterabfrage Zur Überprüfung auf einen Prüfdateisatz anzuwenden. Wählen Sie in der angezeigten Dropdownliste [AutoGen] Zur Überprüfungaus.
Dies ist die Syntax für die Filterabfrage Zur Überprüfung:
(((FileClass="Email") AND (InclusiveType="InclusiveMinus" OR InclusiveType="Inclusive")) OR ((FileClass="Attachment") AND (UniqueInEmailSet="true")) OR ((FileClass="Document") AND (MarkAsRepresentative="Unique")) OR (FileClass="Conversations"))">">
In der folgenden Liste wird das Ergebnis der Filterabfrage in Bezug darauf beschrieben, welche Inhalte angezeigt werden, nachdem Sie sie auf den Prüfdateisatz angewendet haben.
-
E-Mail. Zeigt Elemente an, die als Inclusive (Inklusiv) oder InclusiveMinus (Vollständiger E-Mail-Thread ohne Anlage(n)) markiert sind.
- Inklusiv. Ein inklusives Element ist die letzte Nachricht in einem E-Mail-Thread. Sie enthält alle vorherigen Inhalte im E-Mail-Thread.
- Vollständiger E-Mail-Thread ohne Anlage(n). Ein „Vollständiger E-Mail-Thread ohne Anlage(n)“-Element enthält mindestens eine Anlage, die der bestimmten Nachricht im E-Mail-Thread zugeordnet ist. Ein Prüfer kann den„Vollständiger E-Mail-Thread ohne Anlage(n)“-Wert verwenden, um zu bestimmen, welche bestimmten Nachrichten im E-Mail-Thread Anlagen zugeordnet haben.
- Anlagen. Filtert doppelte Anlagen im selben E-Mail-Satz heraus. Nur Anlagen, die in einem E-Mail-Thread eindeutig sind, werden angezeigt.
- Dokumente und andere. Filtert doppelte Dokumente heraus. Nur Dokumente, die im Prüfdateisatz eindeutig sind, werden angezeigt.
- Teams-Unterhaltungen. Alle Teams-Unterhaltungen (und Viva Engage) im Überprüfungssatz werden angezeigt.
Weitere Informationen zu inklusiven Typen und dokumentinterner Eindeutigkeit finden Sie im Abschnitt zum E-Mail-Threading, der später in dieser Lerneinheit angezeigt wird.
Analysebericht
Anzeigen des Analyseberichts für einen Prüfdateisatz:
- Öffnen Sie den Prüfdateisatz.
- Wählen Sie in der Menüleiste Analysen aus. Wählen Sie im daraufhin angezeigten Dropdownmenü Berichte anzeigen aus.
Als Ergebnis der Analyse besteht der Analysebericht aus sieben Komponenten:
- Zielpopulation. Die Anzahl von E-Mail-Nachrichten, Anlagen und losen Dokumenten, die im Prüfdateisatz gefunden wurden.
-
Dokumente (Anlagen ausgenommen). Die Anzahl der losen Dokumente, die Folgendes sind:
- Pivots
- Eindeutige Duplikate eines Pivots
- Ein exaktes Duplikat eines anderen Dokuments
-
E-Mails. Die Anzahl der E-Mail-Nachrichten, die als Folgendes markiert sind:
- Inklusiv
- Inklusive Kopie
- Vollständiger E-Mail-Thread ohne Anlage(n)
- Keine der obigen Optionen
-
Anlagen. Die Anzahl der E-Mail-Anlagen, die Folgendes sind:
- Eigen
- Duplikate einer anderen E-Mail-Anlage im Prüfdateisatz
- Anzahl von Dokumenten nach Dateityp. Die Anzahl der Dateien, die durch die Dateierweiterung identifiziert werden.
- Dokumente nach Quelle. Eine Zusammenfassung des Inhalts nach der ursprünglichen Datenquelle.
- Nach Prozess aggregierte Dokumente. Eine Zusammenfassung der Inhalte nach Prüfdateisatzprozessen.
Dokumentanalysetool: Erkennung von Quasiduplikaten in eDiscovery (Premium)
Stellen Sie sich eine Gruppe von Dokumenten vor, die überprüft werden müssen, in denen eine Teilmenge auf derselben Vorlage basiert und größtenteils die gleiche Textbausteinsprache aufweist, wobei hier und da einige Unterschiede bestehen. Wenn ein Prüfer diese Teilmenge identifizieren könnte, überprüfen Sie eines der Dokumente gründlich, und überprüfen Sie die Unterschiede für den Rest, hätte er keine eindeutigen Informationen verpasst. Außerdem hätte der Prüfer nur einen Bruchteil der Zeit benötigt, die er benötigt hätte, um alle Dokumente zu lesen, die er abdecken würde.
Hinweis
Bei der Erkennung von Quasiduplikaten werden textuell ähnliche Dokumente gruppiert, um den Überprüfungsvorgang einer Organisation effizienter zu gestalten.
Wie funktioniert die Duplikaterkennung?
Bei Ausführung der Erkennung von Quasiduplikaten analysiert das System jedes Dokument mit Text. Anschließend werden alle Dokumente miteinander verglichen, um zu bestimmen, ob ihre Ähnlichkeit über dem Schwellenwert liegt. Ist dies der Fall, werden die Dokumente gruppiert.
Nachdem alle Dokumente verglichen und gruppiert wurden, wird ein Dokument aus jeder Gruppe als Pivot markiert. Wenn eine Organisation ihre Dokumente überprüft, kann sie zuerst ein Pivot-Dokument überprüfen. Sie kann dann die anderen Dokumente im gleichen Quasiduplikatsatz überprüfen. Die Organisation ermöglicht es Ihnen, sich auf den Unterschied zwischen dem Pivot und dem zu prüfenden Dokument zu konzentrieren.
Dokumentanalysetool: E-Mail-Threading in eDiscovery (Premium)
Stellen Sie sich eine E-Mail-Unterhaltung vor, die bereits seit einer Weile läuft. In den meisten Fällen enthält die letzte Nachricht im E-Mail-Thread den Inhalt aller vorherigen Nachrichten. Daher bietet die Überprüfung der letzten Nachricht einen vollständigen Kontext der Konversation, die im Thread stattgefunden hat.
Hinweis
E-Mail-Threading identifiziert solche Nachrichten, damit Prüfer lediglich einen Bruchteil der gesammelten Nachrichten überprüfen müssen, ohne dass Kontext verloren geht.
Wie funktioniert E-Mail-Threading?
E-Mail-Threading analysiert jeden E-Mail-Thread. Anschließend wird es in einzelne Nachrichten dekonstruiert. Jeder E-Mail-Thread ist eine Kette einzelner Nachrichten.
Microsoft Purview eDiscovery (Premium) analysiert alle E-Mail-Nachrichten im Prüfdateisatz, um zu bestimmen, ob eine E-Mail-Nachricht eindeutigen Inhalt aufweist. Außerdem kann ermittelt werden, ob die Kette (übergeordnete Nachrichten) vollständig in der endgültigen Nachricht im E-Mail-Thread enthalten ist. Am Ende des Prozesses werden E-Mail-Nachrichten in vier Kategorien unterteilt:
- Inklusiv. Eine inklusive E-Mail ist die letzte Nachricht in einem E-Mail-Thread. Sie enthält den gesamten vorherigen Inhalt dieses E-Mail-Threads.
- Vollständiger E-Mail-Thread ohne Anlage(n). Eine E-Mail-Nachricht wird als Vollständiger E-Mail-Thread ohne Anlage(n) festgelegt, wenn mindestens eine Anlage mit der bestimmten Nachricht innerhalb des E-Mail-Threads verknüpft ist. Ein Prüfer kann den "Vollständiger E-Mail-Thread ohne Anlage(n)"-Wert verwenden, um zu bestimmen, welche bestimmte E-Mail-Nachricht innerhalb des Threads Anlagen zugeordnet hat.
- Inklusive Kopie. Eine E-Mail-Nachricht wird als Inklusive Kopie betrachtet, wenn es sich um eine exakte Kopie einer Nachricht handelt, die als Inklusiv oder Vollständiger E-Mail-Thread ohne Anlage(n) gekennzeichnet ist.
- Keine. Der Wert Keine gibt an, dass der Inhalt der Nachricht vollständig in mindestens einer anderen E-Mail-Nachricht enthalten ist, die als Inklusiv oder Vollständiger E-Mail-Thread ohne Anlage(n) gekennzeichnet ist.
Wie unterscheidet es sich von Unterhaltungen in Outlook?
Auf einen Blick klingt E-Mail-Threading ähnlich wie Unterhaltungsgruppierungen in Outlook. Es gibt jedoch einige wichtige Unterschiede. Betrachten Sie eine E-Mail-Unterhaltung, die in zwei Unterhaltungen verzweigt wurde. Beispielsweise hat jemand auf eine E-Mail geantwortet, die nicht die neueste in der Unterhaltung ist. Daher haben die letzten beiden E-Mails in der Unterhaltung jeweils eindeutige Inhalte.
Outlook gruppiert die E-Mails weiterhin in einer einzigen Unterhaltung. Warum? Da nur das Lesen der letzten E-Mail dazu führen könnte, dass der Kontext der vorletzten E-Mail fehlt, die auch eindeutigen Inhalt enthält.
Da E-Mail-Threading jede E-Mail in einzelne Komponenten analysiert und vergleicht, würde E-Mail-Threading beide der letzten beiden E-Mails als inklusiv markieren. Dieser Prozess stellt sicher, dass Sie keinen Kontext verpassen, solange Sie alle E-Mails lesen, die als inklusiv gekennzeichnet sind.
Dokumentanalysetool: Designs in eDiscovery (Premium)
Wie schreibt eine Person ein Dokument? Sie beginnen in der Regel mit einer oder mehreren Ideen, die sie im Dokument vermitteln möchten. Anschließend verfassen sie das Dokument mit Wörtern, die den Ideen entsprechen. Je häufiger eine Idee ist, desto häufiger sind die Wörter, die sich auf diese Idee beziehen.
Dieser Prozess informiert auch darüber, wie Personen Dokumente nutzen. Die wichtigsten Dinge, die beim Lesen eines Dokuments zu verstehen sind:
- Die Ideen, die das Dokument zu vermitteln versucht.
- Wo Ideen erscheinen.
- Welche Beziehungen zwischen den Ideen bestehen.
Diese Elemente können so erweitert werden, wie eine Person eine Gruppe von Dokumenten nutzen möchte. Sie möchten Folgendes sehen:
- Welche Ideen in den Gruppen vorhanden sind.
- Welche Dokumente über diese Ideen sprechen.
- Dokumente anzeigen, in denen ähnliche Ideen besprochen werden, wenn sie ein bestimmtes Dokument von Interesse finden.
Hinweis
Die Funktionalität "Designs" in eDiscovery (Premium) versucht zu imitieren, wie Menschen Dokumente imitieren. Dies geschieht, indem die Designs analysiert werden, die in einem Prüfdateisatz besprochen werden, und ein Design Dokumenten im Prüfdateisatz zugewiesen wird.
In eDiscovery (Premium) gehen Designs einen Schritt weiter und identifizieren das bestimmende Design in jedem Dokument. Das bestimmende Design ist das, das am häufigsten in einem Dokument angezeigt wird.
Wie funktionieren Designs?
Die Funktionalität "Designs" analysiert Dokumente mit Text in einem Prüfdateisatz. Dies geschieht, um allgemeine Designs zu analysieren, die in allen Dokumenten im Prüfdateisatz angezeigt werden.
eDiscovery (Premium) weist diese Themen den Dokumenten zu, in denen sie erscheinen. Außerdem wird jedes Design mit den in den Dokumenten verwendeten Wörtern gekennzeichnet, die für das Design repräsentativ sind. Da ein Dokument verschiedene Thementypen enthalten kann, weist eDiscovery (Premium) Dokumenten häufig mehrere Themen zu. Das Design, das in einem Dokument am stärksten vertreten ist, wird als dominantes Design festgelegt.
Wissenscheck
Wählen Sie für jede der folgenden Fragen die beste Antwort aus.