コンテンツ検索で部分的にインデックスが作成されたアイテム
ヒント
新しい Microsoft Purview ポータルで電子情報開示 (プレビュー) を使用できるようになりました。 新しい電子情報開示エクスペリエンスの使用の詳細については、「電子 情報開示 (プレビュー)」を参照してください。
Microsoft Purview コンプライアンス ポータルから実行するコンテンツ検索では、検索を実行すると、推定検索結果に部分的にインデックスが付いた項目が自動的に含まれます。 部分的にインデックス付けされたアイテムは、何らかの理由で検索用に完全にインデックスが作成されなかった、SharePoint および OneDrive for Business サイト上の Exchange メールボックスアイテムとドキュメントです。 Exchange では、部分的にインデックスが付けられたアイテムには、通常、電子メール メッセージに添付されたファイル (インデックスを作成できないファイルの種類) が含まれています。 電子情報開示検索を実行すると、アイテムに検索用のインデックスを作成できない理由と、部分的にインデックス付けされたアイテムとして返されるその他の理由を次に示します。
- ファイルの種類が認識できないか、インデックス作成でサポートされていない。
- メッセージには、開くことができない添付ファイルがあります。これは、部分的にインデックス付けされた電子メール アイテムの最も一般的な原因です。
- この種のファイルのインデックス付けはサポートされているが、特定のファイルでインデックス付けエラーが発生した。
- メール メッセージに添付されているファイルが多すぎます。
- メール メッセージに添付されたファイルが大きすぎます。
- ファイルが Microsoft 以外のテクノロジで暗号化されている。
- ファイルがパスワードで保護されている。
注:
ほとんどの組織では、コンテンツのボリューム別の割合が 1% 未満で、部分的にインデックスが作成されたサイズで 12% 未満です。 ボリュームとサイズの違いの理由は、ファイルが大きいほど、完全にインデックスを作成できないコンテンツが含まれる可能性が高いためです。
法的調査のために、部分的にインデックスが作成されたアイテムを確認するために、organizationが必要になる場合があります。 また、検索結果をローカル コンピューターにエクスポートするとき、または電子情報開示 (Premium) を使用して分析のために結果を準備するときに、部分的にインデックスが付いた項目を含めるかどうかを指定することもできます。 詳細については、「 電子情報開示での部分的にインデックス付けされた項目の調査」を参照してください。
ヒント
E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview 試用版ハブから開始します。 サインアップと試用期間の詳細については、こちらをご覧ください。
検索用にインデックスが作成されていないファイルの種類
Bitmap (.bmp) や MP3 (.mp3) ファイルなどの特定の種類のファイルには、インデックスを作成できるコンテンツが含まれません。 その結果、Exchange と SharePoint の検索インデックス作成サーバーでは、これらの種類のファイルに対してフルテキスト インデックス作成は実行されません。 これらの種類のファイルは、サポートされていないファイルの種類と見なされます。 既定でまたは管理者によって、フルテキスト インデックス付けが無効になっている種類のファイルもあります。 サポートされていないファイルの種類と無効なファイルの種類は、コンテンツ検索でインデックスのない項目としてラベル付けされます。 前に説明したように、部分的にインデックスが付いた項目は、検索の実行時、ローカル コンピューターへの検索結果のエクスポート、または電子情報開示 (Premium) の検索結果の準備を行うときに、検索結果のセットに含めることができます。
サポートされているファイル形式と無効なファイル形式の一覧については、次の記事を参照してください。
- Exchange - Exchange Search によってインデックスが作成されたファイル形式
- Exchange - Get-SearchDocumentFormat
- SharePoint - SharePoint の既定のクロールされたファイル名拡張子と解析されたファイルの種類
部分的にインデックスが付いたファイルの種類を持つメッセージとドキュメントを検索結果で返すことができます
部分的にインデックスが付いた添付ファイルまたは部分的にインデックスが作成されたすべての SharePoint ドキュメントを含むすべての電子メール メッセージが、部分的にインデックス付けされたアイテムとして自動的に返されるわけではありません。 これは、電子メール メッセージの Subject プロパティや、ドキュメントの Title プロパティや Author プロパティなど、他のメッセージまたはドキュメント プロパティがインデックス付けされ、検索可能であるためです。 たとえば、"財務" をキーワード (keyword)検索すると、電子メール メッセージの件名またはドキュメントのファイル名またはタイトルにキーワード (keyword)が表示される場合、部分的にインデックスが付いた添付ファイルを含むアイテムが返されます。 ただし、キーワード (keyword)がファイルの本文にのみ表示される場合、メッセージまたはドキュメントは部分的にインデックス付きアイテムとして返されます。
同様に、部分的にインデックス付けされた添付ファイルと、部分的にインデックスが付いたファイルの種類のドキュメントを含むメッセージは、インデックスが作成され検索可能な他のメッセージまたはドキュメント プロパティが検索条件と一致する場合に検索結果に含まれます。 検索用のインデックスが付けられたメッセージ プロパティには、送信日と受信日、送信者と受信者、添付ファイルの名前、およびメッセージ本文のテキストが含まれます。 検索用にインデックスが作成されたドキュメント プロパティには、作成日と変更日が含まれます。 そのため、メッセージの添付ファイルは部分的にインデックス付けされたアイテムであっても、他のメッセージまたはドキュメント プロパティの値が検索条件と一致する場合、メッセージは通常の検索結果に含まれます。
コンプライアンス ポータルで電子情報開示ツールを使用して検索できる電子メールとドキュメントのプロパティの一覧については、「 電子情報開示のキーワード クエリと検索条件」を参照してください。
注:
インデックスが作成されたフォルダーからインデックスが作成されていないフォルダーにメールボックスアイテムが移動された場合、フラグはアイテムのインデックスを解除するように設定され、アイテムはインデックスから削除され、検索できません。 後で、同じ項目がインデックスが作成されたフォルダーに戻された場合、フラグはリセットされません。 つまり、アイテムはインデックスが作成されず、検索できません。
検索結果に含まれる部分的にインデックス付けされた項目
organizationは、部分的にインデックス付けされた項目を特定して追加の分析を実行して、それらが何であるか、何が含まれているか、特定の調査に関連しているかどうかを判断する必要がある場合があります。 前に説明したように、検索されるコンテンツの場所に部分的にインデックスが付いた項目は、推定検索結果に自動的に含まれます。 検索結果をエクスポートするとき、または電子情報開示 (Premium) の検索結果を準備するときに、これらの部分的にインデックスが付いた項目を含めるオプションがあります。
部分的にインデックスが作成された項目については、次の点に注意してください。
電子情報開示検索を実行すると、部分的にインデックスが作成された Exchange アイテム (検索クエリによって返される) の合計数とサイズが、ポップアップ ページの検索統計に表示され、 インデックスのないアイテムとしてラベル付けされます。 ポップアップ ページに表示される部分的にインデックス付けされたアイテムに関する統計情報には、SharePoint サイトまたは OneDrive アカウントの部分的なインデックス付きアイテムは含まれません。
結果をエクスポートする検索が、特定のコンテンツの場所またはorganization内のすべてのコンテンツの場所の検索であった場合、検索条件に一致するアイテムを含むコンテンツの場所のインデックスのないアイテムのみがエクスポートされます。 In other words, if no search results are found in a mailbox or site, then any unindexed items in that mailbox or site won't be exported. その理由は、organization内の多数の場所から部分的にインデックスが付いた項目をエクスポートすると、エクスポート エラーの可能性が高くなり、検索結果のエクスポートとダウンロードにかかる時間が長くなる可能性があるためです。
検索対象のすべてのコンテンツの場所から部分的にインデックス付けされたアイテムをエクスポートするには、(検索クエリからキーワードを削除して) すべてのアイテムを返すように検索を構成し、検索結果をエクスポートするときに部分的にインデックス付きアイテムのみをエクスポートします ([認識できない形式のアイテムのみ] を選択するか、[出力オプション] の他の理由でインデックスが作成されていないアイテムのみを選択します)。
検索結果にすべてのメールボックス アイテムを含める場合、または検索クエリでキーワードが指定されていない場合、または日付範囲のみを指定している場合は、部分的にインデックスが作成されたアイテムが含まれる PST ファイルに部分的にインデックスが作成されたアイテムがコピーされない可能性があります。 これは、部分的にインデックスが付いた項目を含むすべての項目が、通常の検索結果に自動的に含まれるためです。
部分的にインデックスが付いた項目はプレビューできません。 検索結果をエクスポートして、検索によって返される部分的にインデックス付きアイテムを表示する必要があります。
さらに、検索結果をエクスポートし、エクスポートに部分的にインデックスが付けられたアイテムを含めると、SharePoint アイテムの部分的なインデックス付きアイテムが Uncrawlable という名前のフォルダーにエクスポートされます。 部分的にインデックス付けされた Exchange アイテムをエクスポートする場合、部分的にインデックスが付いたアイテムが検索クエリとエクスポート設定の構成と一致するかどうかによって、異なる方法でエクスポートされます。
次の表は、インデックス付きアイテムと部分的にインデックスが付いた項目のエクスポート動作と、それぞれが異なるエクスポート構成設定に含まれているかどうかを示しています。
エクスポート構成 検索クエリに一致するインデックス付きアイテム 検索クエリに一致する部分的にインデックス付けされた項目 検索クエリと一致しない部分的にインデックス付けされた項目 インデックス付きのアイテムのみをエクスポートする Exported エクスポート済み (エクスポートされたインデックス付きアイテムに含まれる) エクスポートされない 部分的にインデックスが付いた項目のみをエクスポートする エクスポートされない エクスポート (部分的にインデックス付けされた項目として) エクスポート (部分的にインデックス付けされた項目として) インデックス付きアイテムと部分的にインデックス付きアイテムをエクスポートする Exported エクスポート済み (エクスポートされたインデックス付きアイテムに含まれる) エクスポート (部分的にインデックス付けされた項目として)
日付範囲と部分的にインデックス付けされた項目を除外する
コンテンツ検索とMicrosoft Purview eDiscoveryでは、日付範囲を使用して、部分的にインデックスが付いた項目を検索クエリから返されないように除外することはできません。 つまり、日付範囲の範囲外にある部分的にインデックス付けされた項目は、検索統計および部分的にインデックス付けされた項目をエクスポートするときに、部分的にインデックス付けされた項目として引き続き含まれます。 電子情報開示 (Premium) では、部分的にインデックスが付いたアイテムを収集し、エクスポートする前にレビュー セットでフィルター処理できます。
メッセージのインデックス作成の制限
次の表では、Microsoft 365 の電子情報開示検索で部分的にインデックス付けされたアイテムとして電子メール メッセージが返される可能性があるインデックス作成の制限について説明します。
SharePoint ドキュメントのインデックス作成制限の一覧については、「 SharePoint Online の検索制限」を参照してください。
インデックス作成の制限 | メモ | 説明 |
---|---|---|
添付ファイルの最大サイズ (Excel ファイルを除く) |
150 MB |
インデックス作成のために解析される電子メール添付ファイルの最大サイズ。 この制限を超える添付ファイルはインデックス作成のために解析されません。添付ファイルを含むメッセージは部分的にインデックス付けとしてマークされます。 手記: 解析は、インデックス作成サービスが添付ファイルからテキストを抽出し、句読点やスペースなどの不要な文字を削除し、テキストを (トークン化と呼ばれるプロセスで) 単語に分割し、インデックスに格納するプロセスです。 |
Excel ファイルの最大サイズ |
4 MB |
サイト上にある、またはインデックス作成のために解析される電子メール メッセージに添付されている Excel ファイルの最大サイズ。 この制限を超える Excel ファイルは解析されません。ファイルまたは電子メールでは、添付ファイルを含むメッセージはインデックスなしとしてマークされます。 |
添付ファイルの最大数 |
250 |
インデックス作成のために解析される電子メール メッセージに添付されるファイルの最大数。 メッセージに 250 を超える添付ファイルがある場合、最初の 250 個の添付ファイルが解析され、インデックスが作成され、解析されなかった追加の添付ファイルがあるため、メッセージは部分的にインデックス付けとしてマークされます。 |
添付ファイルの最大深さ |
30 |
解析される入れ子になった添付ファイルの最大数。 たとえば、電子メール メッセージに別のメッセージが添付されていて、添付されたメッセージにドキュメントWord添付されている場合、Word ドキュメントと添付メッセージのインデックスが作成されます。 この動作は、最大 30 個の入れ子になった添付ファイルに対して継続されます。 |
添付されたイメージの最大数 |
0 |
電子メール メッセージに添付されているイメージはパーサーによってスキップされ、インデックスは作成されません。 |
アイテムの解析にかかった最大時間 |
30 秒 |
インデックス作成のためにアイテムの解析に最大 30 秒を費やします。 解析時間が 30 秒を超える場合、項目は部分的にインデックス付けとしてマークされます。 |
パーサーの最大出力 |
200 万文字 |
インデックスが作成されたパーサーからのテキスト出力の最大量。 たとえば、パーサーがドキュメントから 800 万文字を抽出した場合、インデックスが作成されるのは最初の 200 万文字だけです。 |
注釈トークンの最大数 |
200 万 |
電子メール メッセージにインデックスを付けると、各単語には、その単語のインデックス付け方法を指定するさまざまな処理命令で注釈が付けられます。 処理命令の各セットは、注釈トークンと呼ばれます。 Office 365でサービスの品質を維持するために、電子メール メッセージには 200 万の注釈トークンの制限があります。 |
インデックスの最大本文サイズ |
6,700 万文字 |
電子メール メッセージとそのすべての添付ファイルの本文の文字数の合計数。 電子メール メッセージのインデックスが作成されると、メッセージの本文とすべての添付ファイル内のすべてのテキストが 1 つの文字列に連結されます。 インデックスが作成されるこの文字列の最大サイズは 6,700 万文字です。 |
本文内の一意のトークンの最大数 |
100 万 |
前に説明したように、トークンは、コンテンツからテキストを抽出し、句読点とスペースを削除し、インデックスに格納されている単語 (トークンと呼ばれる) に分割した結果です。 たとえば、フレーズ "cat, mouse, bird, dog, dog" には 5 つのトークンが含まれています。 ただし、そのうちの 4 つだけが一意のトークンです。 電子メール メッセージあたり 100 万個の一意のトークンの制限があります。これは、ランダム なトークンでインデックスが大きくなりすぎるのを防ぐのに役立ちます。 |
部分的にインデックス付けされた項目の詳細
- 前述のように、メッセージとドキュメントのプロパティとそのメタデータにはインデックスが作成されるため、インデックス付きメタデータにキーワード (keyword)が表示された場合、キーワード (keyword)検索によって結果が返されることがあります。 ただし、キーワード (keyword)がサポートされていないファイルの種類を持つアイテムのコンテンツにのみ表示される場合、同じキーワード (keyword)検索で同じアイテムが返されない場合があります。 この場合、項目は部分的にインデックス付きアイテムとして返されます。
- 部分的にインデックスが付いた項目が検索クエリの条件と一致したために検索結果に含まれている場合、検索結果をエクスポートするときに部分的にインデックスが付いた項目には含まれません。
- ファイルの種類はインデックス作成でサポートされ、インデックスが作成されますが、インデックス作成エラーや検索エラーが発生して、ファイルが部分的にインデックス付けされた項目として返される可能性があります。 たとえば、大きな Excel ファイルの検索は部分的に成功する可能性がありますが (最初の 4 MB がインデックス付けされているため)、ファイル サイズの制限を超えたため失敗します。 この場合、検索結果と部分的にインデックスが付いた項目として、同じファイルが返される可能性があります。
- Microsoft 暗号化テクノロジで暗号化され、検索の条件に一致する電子メール メッセージに添付されているファイルはプレビューでき、エクスポート時に復号化されます。 現時点では、Microsoft 暗号化テクノロジで暗号化された (SharePoint または OneDrive for Businessに格納されている) ファイルのインデックスが部分的に作成されます。
- S/MIME で暗号化されたメッセージEmail部分的にインデックスが作成されます。 これには、添付ファイルの有無に関係なく、暗号化されたメッセージが含まれます。
- Azure Rights Management を使用して保護されたメッセージEmailインデックスが作成され、検索クエリと一致する場合は検索結果に含まれます。 権限で保護された電子メール メッセージは暗号化解除され、プレビューおよびエクスポートできます。 この機能では、RMS 復号化ロールが割り当てられている必要があります。このロールは既定で eDiscover Manager ロール グループに割り当てられます。
- 電子情報開示ケースに関連付けられたクエリベースの保留を作成すると、部分的にインデックスが作成されたすべてのアイテムが保留されます。 これには、保留の検索条件と一致しない部分的にインデックスが付いた項目が含まれます。 クエリベースの電子情報開示ホールドの作成の詳細については、「 電子情報開示ホールドを作成する」を参照してください。