電子情報開示 (Premium) ケースの検索と分析の設定を構成する
ヒント
新しい Microsoft Purview ポータルで電子情報開示 (プレビュー) を使用できるようになりました。 新しい電子情報開示エクスペリエンスの使用の詳細については、「電子 情報開示 (プレビュー)」を参照してください。
各Microsoft Purview eDiscovery (Premium) ケースの設定を構成して、次の機能を制御できます。
- 準重複と電子メールスレッド
- テーマ
- 自動生成されたレビューセットクエリ
- テキストの無視
- 光学式文字認識
ヒント
E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview 試用版ハブから開始します。 サインアップと試用期間の詳細については、こちらをご覧ください。
ケースの分析設定を構成する
ケースの検索と分析の設定を構成するには:
注:
期間限定で、この従来の電子情報開示エクスペリエンスは、新しい Microsoft Purview ポータルでも利用できます。 電子情報開示 (プレビュー) エクスペリエンス設定でコンプライアンス ポータルのクラシック電子情報開示エクスペリエンスを有効にして、新しい Microsoft Purview ポータルにクラシック エクスペリエンスを表示します。
- [電子情報開示 (プレミアム)] ページで、ケースを選択します。
- [ 設定 ] タブの [ 検索 & 分析] で、[選択] を 選択します。 ケース設定ページが表示されます。 これらの設定は、ケース内のすべてのレビュー セットに適用されます。
この記事の次のセクションでは、ケースに対して構成できる分析設定について説明します。
準重複と電子メールスレッド
このセクションでは、重複検出、ほぼ重複検出、および電子メール スレッドのパラメーターを設定できます。 詳細については、「ほぼ重複検出とEmailスレッド」を参照してください。
- ほぼ重複/電子メールスレッド: オンにすると、レビュー セット内のデータに対して分析を実行するときに、重複検出、ほぼ重複検出、電子メール スレッドがワークフローの一部として含まれます。
- ドキュメントと電子メールの類似性のしきい値: 2 つのドキュメントの類似性レベルがしきい値を超えている場合、両方のドキュメントが同じほぼ重複したセットに配置されます。
- 単語の最小/最大数: これらの設定では、ほぼ重複と電子メールスレッド分析が、少なくとも最小単語数と最大単語数を持つドキュメントでのみ実行されるように指定します。
テーマ
このセクションでは、テーマのパラメーターを設定できます。 詳細については、「 テーマ」を参照してください。
- テーマ: オンにすると、レビュー セット内のデータに対して分析を実行するときに、ワークフローの一部としてテーマ クラスタリングが実行されます。
- テーマの最大数: レビュー セット内のデータに対して分析を実行するときに生成できるテーマの最大数を指定します。
- テーマに数値を含める: オンにすると、テーマを生成するときに数値 (テーマを識別する) が含まれます。
- テーマの最大数を動的に調整します。 特定の状況では、必要な数のテーマを生成するための十分なドキュメントがレビュー セットに存在しない可能性があります。 この設定を有効にすると、電子情報開示 (プレミアム) はテーマの最大数を強制するのではなく、テーマの最大数を動的に調整します。
セット クエリの確認
[分析後に保存された検索をレビュー用に自動的に作成する] チェック ボックスをオンにした場合、電子情報開示 (Premium) は、For Review という名前のレビュー セット クエリを自動生成します。
このクエリは、基本的にレビュー セットから重複するアイテムを除外します。 これにより、レビュー セット内の一意の項目を確認できます。 このクエリは、ケースのレビューセットの分析を実行したときにのみ作成されます。 レビュー セットクエリの詳細については、「レビュー セット 内のデータのクエリ」を参照してください。
テキストの無視
メールの内容に関係なく、メール メッセージに追加される長い免責事項など、特定のテキストによって分析の品質が低下する場合があります。 無視した方がよいテキストがわかっている場合は、テキスト文字列と、テキストを除外する分析機能(準重複、メールのスレッド化、テーマ、関連性)を指定することで、そのテキストを分析から除外できます。 無視されたテキストとして正規表現 (RegEx) を使用することもサポートされています。
光学式文字認識(OCR)
この設定をオンにすると、イメージ ファイルに対して OCR 処理が実行されます。 OCR 処理は、次の状況で実行されます。
- カストディアンと 非カストディアン データ ソース がケースに追加される場合。 画像ファイルに OCR を適用すると、コレクション中にそれらのファイル内のテキストが検索されます。 OCR 処理は、 高度なインデックス作成 プロセス中に実行されます。 OCR は、高度なインデックス作成中に処理されるアイテムに対してのみ実行されます。 たとえば、部分的にインデックスが作成された、または他のインデックス作成エラーが発生した大きな PDF ファイルが高度なインデックス作成中に処理された場合、ファイルには OCR も適用されます。 つまり、OCR 処理は、高度なインデックス作成プロセス中にインデックスが再作成されたファイルでのみ発生します。
つまり、ケースにカストディアンが追加されるが、高度なインデックス作成中にこれらのファイルが処理されないため、一部の電子メールの添付ファイルが OCR 用に処理されない場合があります。
- 他のデータ ソース (カストディアンに関連付けられていない、非カストディアン データ ソースのケースに追加された) のコンテンツがレビュー セットに追加された場合。
- KeyQL 検索 (コレクションの見積もり) は、アイテムにインデックス作成エラーがあり、これらの項目に高度なインデックスを付ける必要がない限り、アイテムに対して OCR を実行しません。
レビュー セットにデータを追加すると、画像テキストをレビュー、検索、タグ付け、分析できます。 抽出したテキストは、レビュー セットで選択した画像ファイルのテキスト ビューアーで表示できます。 詳細については、以下を参照してください: