Informationen zu Such- und Analyseeinstellungen in eDiscovery-Fällen (Vorschau)

Artikel
07/27/2024

Sie können Einstellungen für jeden eDiscovery-Fall (Vorschau) konfigurieren, um die folgenden Funktionen zu steuern:

Erkennung von Quasiduplikaten und E-Mail-Threading
Designs
Automatisch generierte Prüfdateisatz-Abfrage
Ignorieren von Text
Optical Character Recognition (optische Zeichenerkennung)

Tipp

Beginnen Sie mit Microsoft Security Copilot, um neue Wege zu erkunden, um mithilfe der Leistungsfähigkeit von KI intelligenter und schneller zu arbeiten. Erfahren Sie mehr über Microsoft Security Copilot in Microsoft Purview.

Konfigurieren von Analyseeinstellungen für einen Fall

So konfigurieren Sie die Such-und Analyseeinstellungen für einen Fall:

Wechseln Sie zum Microsoft Purview-Portal , und melden Sie sich mit den Anmeldeinformationen für ein Benutzerkonto an, dem eDiscovery-Berechtigungen zugewiesen sind.
Wählen Sie die eDiscovery-Lösung Karte und dann im linken Navigationsbereich Fälle (Vorschau) aus.
Wählen Sie einen Fall und dann Falleinstellungen aus.
Wählen Sie auf der Seite Falleinstellungendie Option Suchen & Analytics aus.
Der Fall Search & Analytics-Seite wird angezeigt. Diese Einstellungen werden in einem Fall auf alle Überprüfungssätze angewendet.
Nachdem Sie die entsprechenden Such- und Analyseoptionen ausgewählt haben, wählen Sie Speichern aus.

In den folgenden Abschnitten in diesem Artikel werden die Analyseeinstellungen beschrieben, die Sie für einen Fall konfigurieren können.

Erkennung von Quasiduplikaten und E-Mail-Threading

In diesem Abschnitt können Sie Parameter für die Erkennung von Duplikaten, die Erkennung nahezuer Duplikate und das E-Mail-Threading festlegen.

Nahezu Duplikate/E-Mail-Threading: Wenn diese Option aktiviert ist, werden die Duplikaterkennung, die Erkennung nahezuer Duplikate und E-Mail-Threading als Teil des Workflows einbezogen, wenn Sie Analysen für die Daten in einem Überprüfungssatz ausführen.
Dokument- und E-Mail-Ähnlichkeitsschwellenwert: Wenn die Ähnlichkeitsstufe für zwei Dokumente den Schwellenwert überschreitet, werden beide Dokumente in denselben nahezu doppelten Satz eingefügt.
Minimale/maximale Anzahl von Wörtern: Diese Einstellungen geben an, dass nahezu Duplikate und E-Mail-Threadinganalysen nur für Dokumente ausgeführt werden, die mindestens die minimale Anzahl von Wörtern und höchstens die maximale Anzahl von Wörtern aufweisen.

Erkennen von Quasiduplikaten

Stellen Sie sich eine Gruppe von Dokumenten vor, die überprüft werden müssen, in denen eine Teilmenge auf derselben Vorlage basiert und größtenteils die gleiche Textbausteinsprache aufweist, wobei hier und da einige Unterschiede bestehen. Wenn ein Prüfer diese Teilmenge identifizieren, eine von ihnen gründlich überprüfen und die Unterschiede im Übrigen überprüfen könnte, hätte er keine eindeutigen Informationen übersehen, während er nur einen Bruchteil der Zeit in Anspruch genommen hätte, um alle Dokumentabdeckungen zu lesen. Bei der Erkennung von Quasiduplikaten werden textuell ähnliche Dokumente gruppiert, um den Überprüfungsvorgang effizienter zu gestalten.

Bei Ausführung der Erkennung von Quasiduplikaten analysiert das System jedes Dokument mit Text. Anschließend werden alle Dokumente miteinander verglichen, um zu bestimmen, ob ihre Ähnlichkeit über dem Schwellenwert liegt. Ist dies der Fall, werden die Dokumente gruppiert. Nachdem alle Dokumente verglichen und gruppiert wurden, wird ein Dokument aus jeder Gruppe als „Pivot“ markiert. Wenn Sie Ihre Dokumente überprüfen, können Sie zuerst das Pivot-Dokument und anschließend die restlichen Dokumente im gleichen Quasiduplikat-Satz überprüfen und sich dabei auf den Unterschied zwischen dem Pivot und dem Dokument konzentrieren, das sich in der Überprüfung befindet.

E-Mail-Threading

Stellen Sie sich eine E-Mail-Unterhaltung vor, die bereits seit einer Weile läuft. In den meisten Fällen enthält die letzte Nachricht im E-Mail-Thread den Inhalt aller vorangehenden Nachrichten. Aus diesem Grund bietet das Überprüfen der letzten Nachricht einen vollständigen Kontext der Konversation, die im Thread stattgefunden hat. E-Mail-Threading identifiziert solche Nachrichten, damit Prüfer lediglich einen Bruchteil der gesammelten Nachrichten überprüfen müssen, ohne dass Kontext verloren geht.

Email Threading analysiert jeden E-Mail-Thread und dekonstruiert ihn in einzelne Nachrichten. Jeder E-Mail-Thread ist eine Kette einzelner Nachrichten. eDiscovery (Vorschau) analysiert alle E-Mail-Nachrichten im Überprüfungssatz, um festzustellen, ob eine E-Mail-Nachricht eindeutigen Inhalt aufweist oder ob die Kette (übergeordnete Nachrichten) vollständig in der endgültigen Nachricht im E-Mail-Thread enthalten ist. Email Nachrichten sind in vier inklusive Werte unterteilt:

Inklusive: Eine inklusive E-Mail ist die letzte E-Mail-Nachricht in einem E-Mail-Thread und enthält den gesamten vorherigen Inhalt dieses E-Mail-Threads.
Inklusives Minus: Eine E-Mail-Nachricht wird als Inklusives Minus bezeichnet, wenn der spezifischen Nachricht innerhalb des E-Mail-Threads mindestens eine Anlage zugeordnet ist. Ein Prüfer kann den "Vollständiger E-Mail-Thread ohne Anlage(n)"-Wert verwenden, um zu bestimmen, welche bestimmte E-Mail-Nachricht innerhalb des Threads Anlagen zugeordnet hat.
Inklusive Kopie: Eine E-Mail-Nachricht wird als inklusive Kopie betrachtet, wenn es sich um eine exakte Kopie einer inklusiven oder inklusiven Minusnachricht handelt.
Keine: Der Wert None gibt an, dass der Inhalt der Nachricht vollständig in mindestens einer anderen E-Mail-Nachricht enthalten ist, die als Inklusive oder Inklusive Minus gekennzeichnet ist.

Wie unterscheidet es sich von Unterhaltungen in Outlook?

Auf einen Blick klingt dies ähnlich wie Konversationsgruppierungen in Outlook. Es gibt jedoch einige wichtige Unterschiede. Stellen Sie sich eine E-Mail-Unterhaltung vor, die in zwei Unterhaltungen gespalten wurde. für instance hat jemand auf eine E-Mail geantwortet, die nicht die neueste in der Unterhaltung ist, sodass beide die letzten beiden E-Mails in der Unterhaltung eindeutigen Inhalt haben.

Outlook würde die E-Mails weiterhin in einer einzigen Unterhaltung gruppieren. Wenn Sie nur die letzte E-Mail lesen, kann der Kontext der vorletzten E-Mail, die ebenfalls eindeutigen Inhalt enthält, fehlen. Da beim E-Mail-Threading jede E-Mail in einzelne Komponenten analysiert und verglichen wird, würde E-Mail-Threading beide der letzten beiden E-Mails als inklusiv markieren, um sicherzustellen, dass Sie keinen Kontext verpassen, solange Sie alle E-Mails lesen, die als inklusiv gekennzeichnet sind.

Designs

In diesem Abschnitt können Sie die folgenden Parameter für Designs festlegen:

Themen: Wenn diese Option aktiviert ist, wird das Clustering von Designs als Teil des Workflows ausgeführt, wenn Sie Analysen für die Daten in einem Überprüfungssatz ausführen.
Maximale Anzahl von Designs: Gibt die maximale Anzahl von Designs an, die generiert werden können, wenn Sie Analysen für die Daten in einem Überprüfungssatz ausführen.
Einschließen von Zahlen in Designs: Wenn diese Option aktiviert ist, werden Zahlen (die ein Design identifizieren) beim Generieren von Designs einbezogen.
Passen Sie die maximale Anzahl von Designs dynamisch an: In bestimmten Situationen gibt es möglicherweise nicht genügend Dokumente in einem Überprüfungssatz, um die gewünschte Anzahl von Themen zu erzeugen. Wenn diese Einstellung aktiviert ist, passt eDiscovery die maximale Anzahl von Designs dynamisch an, anstatt zu versuchen, die maximale Anzahl von Designs zu erzwingen.

Wenn Sie ein neues Dokument erstellen, beginnen Sie in der Regel mit einer oder mehreren Ideen, die Sie im Dokument vermitteln möchten, und erstellen sie dann mit Wörtern, die diesen Ideen entsprechen. Je häufiger eine Idee ist, desto häufiger sind die Wörter, die sich auf diese Idee beziehen. Diese Methode richtet sich auch an die Art und Weise aus, wie Leser Dokumente nutzen. Die wichtigsten Dinge, die beim Lesen eines Dokuments zu verstehen sind, sind die Standard Ideen, die das Dokument zu vermitteln versucht. Dazu gehört auch, welche Ideen wo erscheinen und welche Beziehungen zwischen den Ideen bestehen.

Dieser Prozess kann auf die Art und Weise erweitert werden, wie ein eDiscovery-Prüfer eine Reihe von Dokumenten in einem Fall nutzen möchte. Sie wollen sehen, welche Ideen in den Review-Sets vorhanden sind und welche Dokumente über diese Ideen sprechen. Wenn sie ein bestimmtes Dokument von Interesse finden, möchten sie In der Lage sein, Dokumente anzuzeigen, in denen ähnliche Ideen besprochen werden.

Die Funktionalität Designs in eDiscovery versucht, die Argumentation von Personen über Dokumente nachzuahmen, indem die themen analysiert werden, die in einem Überprüfungssatz besprochen werden, und den Dokumenten im Überprüfungssatz ein Design zugewiesen wird. In eDiscovery geht Designs noch einen Schritt weiter und identifiziert das dominante Design in jedem Überprüfungssatz und Dokument. Das dominante Design ist das, das am häufigsten in einem Dokument angezeigt wird.

Wie funktionieren Designs?

Die Designfunktion analysiert Dokumente mit Text in einem Überprüfungssatz, um allgemeine Designs zu analysieren, die in allen Dokumenten im Überprüfungssatz angezeigt werden. eDiscovery weist diese Designs den Dokumenten zu, in denen Sie enthalten sind. Außerdem wird jedes Design mit den in den Dokumenten verwendeten Wörtern gekennzeichnet, die für das Design repräsentativ sind. Da ein Dokument verschiedene Arten von Themen enthalten kann, weist eDiscovery überprüfungssätzen und Dokumenten häufig mehrere Designs zu. Dies wird als Themenliste bezeichnet. Das Design, das in einem Rezensionssatz oder Dokument am prominentesten angezeigt wird, wird als dominantes Design bezeichnet.

Konfigurieren von Designs

Designs werden für Fälle unterstützt und gelten für alle darin enthaltenen Überprüfungssätze. Sie können die Einstellungen für Designs konfigurieren, wenn Sie einen neuen Fall erstellen, oder Sie können die Designeinstellungen für einen vorhandenen Fall aktualisieren.

Führen Sie die folgenden Schritte aus, um Designs in einem Fall zu konfigurieren:

Wechseln Sie zum Microsoft Purview-Portal , und melden Sie sich mit den Anmeldeinformationen für ein Benutzerkonto an, dem eDiscovery-Berechtigungen zugewiesen sind.
Wählen Sie die eDiscovery-Lösung Karte und dann im linken Navigationsbereich Fälle (Vorschau) aus.
Wählen Sie einen Fall und dann Falleinstellungen aus.
Wählen Sie auf der Seite Falleinstellungendie Option Suchen & Analytics aus.
Wählen Sie je nach Bedarf die folgenden Designoptionen aus:
- Maximale Anzahl von Designs: Gibt die maximale Anzahl von Designs an, die generiert werden können, wenn Sie Analysen für die Daten in Prüfsätzen ausführen, die in einem Fall enthalten sind. Weitere Informationen zu Grenzwerten finden Sie unter Grenzwerte in eDiscovery.
- Einschließen von Zahlen in Designs: Zahlen (die ein Design identifizieren) werden beim Generieren von Designs eingeschlossen.
- Passen Sie die maximale Anzahl von Designs dynamisch an: In bestimmten Situationen gibt es möglicherweise nicht genügend Dokumente in einem Überprüfungssatz, um die gewünschte Anzahl von Themen für den Fall zu erzeugen. Wenn diese Einstellung aktiviert ist, wird die maximale Anzahl von Designs dynamisch angepasst, anstatt zu versuchen, die maximale Anzahl von Designs zu erzwingen.
Wenn Sie Schlüsselwörter ausschließen müssen, die designs zugeordnet sind, geben Sie den erforderlichen Text oder regulären Ausdruck in das Textfeld Ignorieren ein . Wählen Sie im Feld Übernehmen fürdie Option Designs aus, um den Text oder regulären Ausdruck auf alle Designs anzuwenden.
Klicken Sie auf Speichern.

Nachdem ein neuer Fall erstellt wurde, werden analysen automatisch für die Daten ausgeführt, wenn die Überprüfungssätze dem Fall hinzugefügt werden. Designs für die Überprüfungssätze werden im Rahmen der Analyseverarbeitung generiert.

Prüfdateisatz-Abfrage

Wenn Sie das Kontrollkästchen Zur Überprüfung gespeicherte Suche automatisch erstellen aktivieren , generiert eDiscovery automatisch eine Überprüfungssatzabfrage mit dem Namen For Review.

Diese Abfrage filtert doppelte Elemente aus dem Überprüfungssatz heraus, sodass Sie die eindeutigen Elemente im Überprüfungssatz schnell überprüfen können. Diese Abfrage wird nur erstellt, wenn Sie einen Prüfdateisatz innerhalb des Falls einer Analyse unterziehen. Weitere Informationen zu Überprüfungssatzabfragen finden Sie unter Abfragen der Daten in einem Überprüfungssatz.

Ignorieren von Text

Es gibt Situationen, in denen bestimmte Texte die Qualität der Analyse beeinträchtigen, z. B. langwierige Haftungsausschlüsse, die E-Mail-Nachrichten unabhängig vom Inhalt der E-Mail hinzugefügt werden. Wenn Sie Text kennen, der ignoriert werden sollte, können Sie ihn aus der Analyse ausschließen, indem Sie die Textzeichenfolge und die Analysefunktionen (Nahezu-Duplikate, E-Mail-Threading, Designs und Relevanz) angeben, für die der Text ausgeschlossen werden soll. Die Verwendung regulärer Ausdrücke (RegEx) für ignorierten Text wird ebenfalls unterstützt.

Optical Character Recognition (OCR; optische Zeichenerkennung)

Wenn diese Einstellung aktiviert ist, wird die OCR-Verarbeitung für Bilddateien ausgeführt. Die OCR-Verarbeitung wird in den folgenden Situationen ausgeführt:

Wenn Datenquellen zu einem Fall hinzugefügt werden: Wenn OCR auf Bilddateien angewendet wird, ist der Text in diesen Dateien in den Suchergebnissen verfügbar. Die OCR-Verarbeitung wird während des erweiterten Indizierungsprozesses ausgeführt (wenn diese Option in der Suchabfrage ausgewählt ist). OCR wird nur für Elemente ausgeführt, die während der erweiterten Indizierung verarbeitet werden. Wenn z. B. eine große PDF-Datei, die teilweise indiziert ist oder andere Indizierungsfehler aufweist, während der erweiterten Indizierung verarbeitet wird, wurde für die Datei OCR angewendet. Die OCR-Verarbeitung erfolgt nur für Dateien, die während des erweiterten Indizierungsprozesses neu indiziert werden. Dies bedeutet, dass es Situationen geben kann, in denen Datenquellen zu einem Fall hinzugefügt werden, aber einige E-Mail-Anlagen nicht für OCR verarbeitet werden, da diese Dateien während der erweiterten Indizierung nicht verarbeitet werden.
Wenn Inhalte aus anderen Datenquellen hinzugefügt werden: Dies gilt für Datenquellen, die keinem Fall zugeordnet sind und wenn die Suchergebnisse einem Überprüfungssatz hinzugefügt werden.

Nachdem Daten zu einem Überprüfungssatz hinzugefügt wurden, kann der Bildtext überprüft, durchsucht, markiert und analysiert werden. Sie können den extrahierten Text im Text-Viewer der ausgewählten Bilddatei im Überprüfungssatz anzeigen. Weitere Informationen finden Sie unter:

Freigeben über