EDM SIT スキーマとルール パッケージを作成する (新しいエクスペリエンス)
Microsoft Purview コンプライアンス ポータルで 1 つのワークフローを使用することで、新しいエクスペリエンスで完全なデータ一致 (EDM) スキーマと EDM 機密情報の種類 (SIT) の両方を作成できます。
ヒント
E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンス ポータルのトライアル ハブで今すぐ開始してください。 サインアップと試用期間の詳細については、こちらをご覧ください。
適用対象
- 新しいエクスペリエンス
クラシック エクスペリエンスを使用して EDM SIT を作成する場合は、「 EDM SIT (クラシック エクスペリエンス) の作成」を参照してください。 使用するエクスペリエンスの決定に関するヘルプが必要な場合は、「 適切な EDM SIT 作成エクスペリエンスを選択する」を参照してください。
はじめに
この記事で説明する手順を開始する前に、次の記事の手順を完了してください。
EDM ベースの SID やその実装に慣れていない場合は、次の記事の概念を理解することが 不可欠 です。
- 機密情報の種類に関する詳細情報
- 完全なデータ一致に基づく機密情報の種類の詳細
- マルチトークン マッチングについて学習する
- 完全なデータ一致に基づく機密情報の種類の使用を開始する
- SIT と完全一致するデータを作成する (新しいエクスペリエンス)
- 機密情報の種類のエンティティ定義
アクセス許可
コンプライアンス ポータルを使用してカスタム機密情報の種類を作成、テスト、展開するには、 グローバル管理者 またはコンプライアンス 管理者 のアクセス許可が必要です。 ロールとアクセス許可の詳細については、「Office 365の管理者ロールについて」を参照してください。
重要な考慮事項
EDM スキーマと EDM ベースの SID を作成するときに考慮する必要がある重要な考慮事項をいくつか次に示します。
主な要素を選択する前 に、 組み込みの SID を 確認して、ニーズに最適なものを確認します。
EDM SIT ごとに、少なくとも 1 つのプライマリ要素を選択し、 10 個以下のプライマリ要素を選択する必要があります。 複数トークンの裏付けデータ フィールドがある場合は、次のいずれかのオプションを選択します。
- [ マルチトークン マッチング] を選択します。
- マルチトークン フィールド内の要素を、そのコンテンツを検出できる SIT にマップします。 (マップする一意の値を持つフィールドが多いほど、EDM SIT の精度が高くなります。複数のフィールドをマッピングすると、パフォーマンスの向上、処理負荷の軽減、システム タイムアウトの回避にも役立ちます)。
SIT の主要な要素を選択するときは、 データ テーブル内の各行が一意であることを確認するフィールドを選択します。 たとえば、 や
DateOfBirth
などのFirstName
フィールドは使用しないでください。 どうしてでしょうか? 名と生年月日は機密データ テーブル全体で重複する可能性があるためです。 代わりに、またはBankAccountNumber
などのSocialSecurityNumber
一意の値を持つフィールドを使用します。推薦:サンプル データ ファイルから EDM スキーマをビルドします。 この推奨事項に従って、サンプル データ ファイルが次の要件に準拠していることを確認します。
- データは、列と行を含むテーブルとして編成する必要があります。 列ヘッダーにはフィールド名を使用します。 (テーブル内の行は、個々のデータ項目に対応します)。
- フィールド名には英数字のみを含めることができます。
- フィールド名は文字で始まる必要があり、少なくとも 3 文字の英数字で構成されている必要があります。
- これらの名前付け要件が満たされていない場合は、サンプル データ ファイルのアップロード時にエラーが発生する可能性があります。
機密情報のサンプル ファイルを使用して EDM SIT を構成する場合、システムは、アップロードされたデータを最もよく検出するフィールドごとに既存の SIT を提案します (そのような SIT が使用可能な場合)。 Microsoft Purview では、機密性の高いコンテンツを検出するために、既定で単一トークン の照合が行われます。 そのため、EDM スキーマ内のフィールドのデータを検出できる既存の SID がない場合は、単一トークン一致モードが適用されます。 各要素に対して推奨される SIT によって、監視する正確な文字列が検出されることを確認することが重要です。
- 推奨される SIT に、検出する コンテンツとは異なる周囲の文字が含まれていないことを確認します。
- 推奨される SIT で、機密情報テーブルに格納されている文字列の有効な部分が除外されていないことを確認します。
- 使用する SIT が、検出するデータの形式と密接に一致していることを確認します。 たとえば、単に
digits
A combination of 32 characters consisting of letters and digits
text strings
ではなく 、 や チェック ではなく をNine digits with optional hyphens or spaces
探します。
検出しようとしているデータの形式と密接に一致する SID を使用することは、結果の精度を向上させ、照合が完了するまでの時間を短縮するもう 1 つの方法です。
注:
すべてのデータは、選択中にツールを使用して前方 (次へ) と後方 (戻る) に移動すると保存されます。 後方ナビゲーションでは、最上位のページから最上位のページへの移動と、サブページからサブページへの移動のみがサポートされます。 最上位のページから前のサブページに戻ったり、サブページから前の最上位ページに移動したりすることはできません。
EDM スキーマと SIT を作成する
次の手順では、新しいエクスペリエンスを使用して EDM スキーマと SID を作成するためのステップ バイ ステップ ガイダンスを示します。 プロセス全体の概念の概要と図については、「 EDM ワークフローの概要 (新しいエクスペリエンス)」を参照してください。
手順
テナントのコンプライアンス ポータルで、[ データ分類>EDM 分類子] に移動します。
[新しい EDM エクスペリエンス] トグルが [オン] に設定されていることを確認します。
[ + EDM 分類子の作成] を選択します。
SIT に名前を付け、説明を追加します。 システムでは、生成される関連付けられた スキーマに対して、この名前をスキーマという単語に追加して使用します。
[次へ]を選択します。
スキーマに使用するメソッドを選択します。 サンプル データを含むファイルをアップロードするか、データ 構造を手動で定義します。 (ベスト プラクティスは、サンプル データ ファイルをアップロードすることです。この手順の残りの部分では、このオプションを前提としています)。
どちらの場合も、「 サンプル ファイルの EDM SIT サンプル ファイルの作成 (新しいエクスペリエンス)」 で説明されている情報が必要です。[次へ]を選択します。
サンプル ファイルを選択し、[ ファイルのアップロード] を選択します。 [次へ]を選択します。
(アップロード中にエラーが表示される場合は、エラーに対処してからやり直してください)。[ プライマリ要素の選択] ページで、次の手順を実行します。
- [ プライマリ要素 ] 列で、プライマリ要素を選択します。 各プライマリ要素は SIT にマップする必要があります。 ベスト プラクティスは、[一致検証] 列の下に [完全一致] と表示されるフィールドを選択することです。
- 各フィールドの [一致モード ] 列で、適用する次の一致オプションを指定します。
- オプション 1: システムが提案する SIT を受け入れるには何もしないでください。
- オプション 2: ドロップダウン メニューを展開します。 [ 機密情報の種類 (SIT)] で、鉛筆 (編集) アイコンを選択し、別の既存の SIT を選択します。
- オプション 3: [ 一致モード ] で、[ 単一トークン] を選択します。
- オプション 4: [ 一致モード ] で、[ マルチトークン] を選択します。
[次へ]を選択します。
選択した列のデータの設定を構成します。
- トグル [ すべての列に同じ設定を使用する] は、既定で [オン] に設定されています。 データ フィールドごとに個別の設定を使用する場合は、トグルを [オフ] に設定します。
- [ 列内のデータは大文字と小文字を区別しない ] オプションが既定で選択されています。 大文字と小文字を区別する検出を適用するには、このボックスをオフにします。
- 必要に応じて、[ すべての列のデータの区切り記号と句読点を無視 する] オプションを選択します。次に、一覧から無視する区切り記号と句読点を選択するか、カスタム区切り記号と句読点を入力して無視できます。
重要
スキーマのプライマリ要素列の [区切り記号を無視 する] オプションを選択した場合は、マップ先の SIT が、選択した区切り記号の有無にかかわらずデータと一致するように設計されていることを確認します。
- [送信] を選択します。
完了すると、EDM は、特定した主要な要素ごとに 1 つの検出ルールを自動的に生成します。 また、 高信頼 度ルールと 中程度の信頼度 ルールも作成されます。 信頼度の高いルールには、中程度の信頼度ルールよりも一致する要件が多く、さらに低信頼度ルールよりも多くの要件があります。 (低信頼度ルールは手動で作成する必要があります)。これらのルールは、[ プライマリ要素の検出ルールの構成] ページで確認および編集できます。
ヒント
プライマリとして選択されていないこれらの要素は、引き続き裏付け (サポート) 証拠として使用できます。 主要要素に対して定義された近接性にあるサポート要素が多いほど、一致が真正であるという信頼度が高くなります。
推奨事項
スキーマを作成または編集してから少なくとも 1 時間待ってから、EDM データのアップロードにスキーマをダウンロードして使用します。 これは、スキーマがシステムと同期されていることを確認するのに役立ちます。 スキーマのダウンロードが早すぎる場合は、コマンド ラインを使用してスキーマをダウンロードしようとすると、エラー メッセージが表示されることがあります。
EDM アップロード エージェントを使用してスキーマをダウンロード、手動で編集、再アップロードしないでください。 EDM Upload Agent を使用してスキーマをダウンロードすると、スキーマ作成チェックに合格しないスキーマにタグが追加されるため、エラーが発生します。
すべての裏付け証拠が確実に検出されるようにするには、次のいずれかのアクションを実行します。 - マルチトークン検証証拠フィールドを、マルチトークン機能でサポートされているトークンの最大数 (現在 5 つのトークン) にトリミングします。
- マルチトークン データを完全に検出できる SIT にマルチトークン フィールドをマップします。 - EDM SIT を作成または編集した後、次の PowerShell コマンドレットを使用してテストし、24 時間待ってから、データ損失防止 (DLP) ポリシー ソリューションでテストします。
Test-DataClassification -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]”