次の方法で共有


電子情報開示のほぼ重複検出 (Premium)

重要

この記事は、従来の 電子情報開示エクスペリエンスにのみ適用されます。 クラシック電子情報開示エクスペリエンスは 2025 年 8 月に廃止 され、廃止後は Microsoft Purview ポータルのエクスペリエンス オプションとして利用できなくなります。

この移行の計画を早い段階で開始し、 Microsoft Purview ポータルで新しい電子情報開示エクスペリエンスの使用を開始することをお勧めします。 最新の電子情報開示機能と機能の使用の詳細については、「 電子情報開示の詳細」を参照してください。

サブセットが同じテンプレートに基づいており、ほとんど同じボイラープレート言語を持ち、ところどころにいくつかの違いがある、レビュー対象の一連のドキュメントを考えてみましょう。 校閲者がこのサブセットを特定し、そのうちの 1 つを徹底的に確認し、残りの部分の違いを確認できる場合、カバーするすべてのドキュメントの読み取りにかかる時間をわずかしかかからずに、一意の情報を見逃す必要はありません。 準重複の検出グループは、テキスト的に類似したドキュメントをまとめてグループ化し、レビュープロセスをより効率的にします。

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview 試用版ハブから開始します。 サインアップと試用期間の詳細については、こちらをご覧ください。

どのような仕組みですか?

準重複の検出が実行されると、システムはテキストを含むすべてのドキュメントを解析します。 次に、すべてのドキュメントを互いに比較して、それらの類似度を設定したしきい値よりも大きいかどうかを判断します。 大きい場合は、ドキュメントはグループ化されます。 すべてのドキュメントが比較およびグループ化されると、各グループのドキュメントが「ピボット」としてマークされます。ドキュメントのレビューでは、最初にピボットをレビューし、同じ準重複セット内の他のドキュメントをレビューして、ピボットとレビュー中のドキュメントの違いに焦点を合わせることができます。