電子情報開示 (Premium) ケースの検索と分析の設定を構成する

[アーティクル]
10/31/2024

ヒント

新しい Microsoft Purview ポータルで電子情報開示 (プレビュー) を使用できるようになりました。新しい電子情報開示エクスペリエンスの使用の詳細については、「電子情報開示 (プレビュー)」を参照してください。

各Microsoft Purview eDiscovery (Premium) ケースの設定を構成して、次の機能を制御できます。

準重複と電子メールスレッド
テーマ
自動生成されたレビューセットクエリ
テキストの無視
光学式文字認識

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータセキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview 試用版ハブから開始します。サインアップと試用期間の詳細については、こちらをご覧ください。

ケースの分析設定を構成する

ケースの検索と分析の設定を構成するには:

注:

期間限定で、この従来の電子情報開示エクスペリエンスは、新しい Microsoft Purview ポータルでも利用できます。電子情報開示 (プレビュー) エクスペリエンス設定でコンプライアンスポータルのクラシック電子情報開示エクスペリエンスを有効にして、新しい Microsoft Purview ポータルにクラシックエクスペリエンスを表示します。

[電子情報開示 (プレミアム)] ページで、ケースを選択します。
[ 設定 ] タブの [ 検索 & 分析] で、[選択] を 選択します。ケース設定ページが表示されます。これらの設定は、ケース内のすべてのレビューセットに適用されます。

この記事の次のセクションでは、ケースに対して構成できる分析設定について説明します。

準重複と電子メールスレッド

このセクションでは、重複検出、ほぼ重複検出、および電子メールスレッドのパラメーターを設定できます。詳細については、「ほぼ重複検出とEmailスレッド」を参照してください。

ほぼ重複/電子メールスレッド: オンにすると、レビューセット内のデータに対して分析を実行するときに、重複検出、ほぼ重複検出、電子メールスレッドがワークフローの一部として含まれます。
ドキュメントと電子メールの類似性のしきい値: 2 つのドキュメントの類似性レベルがしきい値を超えている場合、両方のドキュメントが同じほぼ重複したセットに配置されます。
単語の最小/最大数: これらの設定では、ほぼ重複と電子メールスレッド分析が、少なくとも最小単語数と最大単語数を持つドキュメントでのみ実行されるように指定します。

テーマ

このセクションでは、テーマのパラメーターを設定できます。詳細については、「テーマ」を参照してください。

テーマ： オンにすると、レビューセット内のデータに対して分析を実行するときに、ワークフローの一部としてテーマクラスタリングが実行されます。
テーマの最大数: レビューセット内のデータに対して分析を実行するときに生成できるテーマの最大数を指定します。
テーマに数値を含める: オンにすると、テーマを生成するときに数値 (テーマを識別する) が含まれます。
テーマの最大数を動的に調整します。 特定の状況では、必要な数のテーマを生成するための十分なドキュメントがレビューセットに存在しない可能性があります。この設定を有効にすると、電子情報開示 (プレミアム) はテーマの最大数を強制するのではなく、テーマの最大数を動的に調整します。

セットクエリの確認

[分析後に保存された検索をレビュー用に自動的に作成する] チェックボックスをオンにした場合、電子情報開示 (Premium) は、For Review という名前のレビューセットクエリを自動生成します。

For Review 自動生成クエリ。

このクエリは、基本的にレビューセットから重複するアイテムを除外します。これにより、レビューセット内の一意の項目を確認できます。このクエリは、ケースのレビューセットの分析を実行したときにのみ作成されます。レビューセットクエリの詳細については、「レビューセット内のデータのクエリ」を参照してください。

テキストの無視

メールの内容に関係なく、メールメッセージに追加される長い免責事項など、特定のテキストによって分析の品質が低下する場合があります。無視した方がよいテキストがわかっている場合は、テキスト文字列と、テキストを除外する分析機能（準重複、メールのスレッド化、テーマ、関連性）を指定することで、そのテキストを分析から除外できます。無視されたテキストとして正規表現 (RegEx) を使用することもサポートされています。

光学式文字認識（OCR）

この設定をオンにすると、イメージファイルに対して OCR 処理が実行されます。 OCR 処理は、次の状況で実行されます。

カストディアンと非カストディアンデータソースがケースに追加される場合。画像ファイルに OCR を適用すると、コレクション中にそれらのファイル内のテキストが検索されます。 OCR 処理は、高度なインデックス作成プロセス中に実行されます。 OCR は、高度なインデックス作成中に処理されるアイテムに対してのみ実行されます。たとえば、部分的にインデックスが作成された、または他のインデックス作成エラーが発生した大きな PDF ファイルが高度なインデックス作成中に処理された場合、ファイルには OCR も適用されます。つまり、OCR 処理は、高度なインデックス作成プロセス中にインデックスが再作成されたファイルでのみ発生します。

つまり、ケースにカストディアンが追加されるが、高度なインデックス作成中にこれらのファイルが処理されないため、一部の電子メールの添付ファイルが OCR 用に処理されない場合があります。

他のデータソース (カストディアンに関連付けられていない、非カストディアンデータソースのケースに追加された) のコンテンツがレビューセットに追加された場合。
KeyQL 検索 (コレクションの見積もり) は、アイテムにインデックス作成エラーがあり、これらの項目に高度なインデックスを付ける必要がない限り、アイテムに対して OCR を実行しません。

レビューセットにデータを追加すると、画像テキストをレビュー、検索、タグ付け、分析できます。抽出したテキストは、レビューセットで選択した画像ファイルのテキストビューアーで表示できます。詳細については、以下を参照してください:

次の方法で共有

電子情報開示 (Premium) ケースの検索と分析の設定を構成する

ケースの分析設定を構成する

準重複と電子メールスレッド

テーマ

セットクエリの確認

テキストの無視

光学式文字認識（OCR）

フィードバック

その他のリソース

次の方法で共有

電子情報開示 (Premium) ケースの検索と分析の設定を構成する

ケースの分析設定を構成する

準重複と電子メールスレッド

テーマ

セット クエリの確認

テキストの無視

光学式文字認識（OCR）

フィードバック

その他のリソース

セットクエリの確認