トレーニング可能な分類子の詳細
コンテンツを適切に保護および処理できるようにコンテンツを分類およびラベル付けすることは、情報保護規範の出発点です。 Microsoft Purview には、 コンテンツを手動で分類する方法、 自動パターン マッチングを使用する方法、 分類子を使用する方法の 3 つがあります。
ヒント
E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview 試用版ハブから開始します。 サインアップと試用期間の詳細については、こちらをご覧ください。
手動
コンテンツを手動で分類するには、人間の判断とアクションが必要です。 ユーザーと管理者は、コンテンツの検出時にコンテンツを分類します。 既存のラベルと機密情報の種類を使用することも、自分で作成したラベルを使用することもできます。 その後、コンテンツを保護し、その処分を管理できます。
自動パターン マッチング
これらの分類メカニズムには、次を使用したコンテンツの検索が含まれます。
- キーワードまたはメタデータの値 (クエリ言語キーワード (keyword))
- 社会保障、信用カード、銀行口座番号などの機密情報の以前に識別されたパターン (機密情報の種類のエンティティ定義)
- ドキュメントフィンガープリント: テンプレートのバリエーションであるため、アイテムを認識する
- 正確なデータ一致の文字列の存在
その後、秘密度ラベルと保持ラベルを自動的に適用して、コンテンツを保持ラベルのMicrosoft Purview データ損失防止と自動適用ポリシーに関する記事で使用できるようにします。
分類子
この分類方法は、手動または自動のパターンマッチングメソッドを使用して簡単に識別できないコンテンツに適しています。 この分類方法は、分類子を使用して、アイテム内にある要素 (パターン マッチング) ではなく、アイテムの内容に基づいて項目を識別するように設計されています。 分類子は、検出するコンテンツの数百の例を見て、コンテンツの種類を識別する方法を学習します。
注:
プレビュー: コンテンツ エクスプローラーでトレーニング可能な分類子を表示するには、フィルター パネルで [ トレーニング可能な分類子] を展開します。 トレーニング可能な分類子は、ラベル付けを必要とせずに、SharePoint、Teams、OneDrive で見つかったインシデントの数を自動的に表示します。 この機能を使用しない場合は、Microsoft サポートで要求を提出する必要があります。 これにより、コンテンツ エクスプローラー内のラベル付けポリシーで使用されていない機密データの表示が無効になります。 データのスキャンを無効にすることもできます。 スキャンがオフになっている場合、これらの分類子を使用した秘密度ラベル付けと DLP ポリシーは機能しません。
分類子を使用できる場所
分類子は、次の条件として使用できます。
- 秘密度ラベルを使用した Office ファイルの自動ラベル付け
- 条件に基づくアイテム保持ラベル ポリシーの自動的な適用
- 通信コンプライアンス
- 秘密度ラベルの条件。 (「 Microsoft 365 データに秘密度ラベルを自動的に適用する」を参照してください)
- データ損失防止
重要
分類子は、暗号化されていない項目でのみ機能します。
分類子のタイプ
-
事前トレーニング済み分類子 - Microsoft では、トレーニングなしで使用を開始できる複数の分類子を作成し、事前トレーニングしました。 これらの分類子は、
Ready to use
の状態で表示されます。 - カスタムトレーニング可能な分類子 - 事前トレーニング済みの分類子がカバーするものを超えてコンテンツを識別して分類する必要がある場合は、独自の分類子を作成してトレーニングできます。
事前トレーニングされたすべての分類子の完全な一覧については、「 トレーニング可能な 分類子の定義」を参照してください。
カスタム分類子
重要
言語の制限: カスタム分類子のサポートは英語に制限されています。
事前トレーニングされた分類子がニーズを満たしていない場合は、独自の分類子を作成してトレーニングできます。 独自の作成に関連する作業は増えますが、organizationのニーズに合わせて調整した方が適切です。
カスタムトレーニング可能な分類子を作成するには、まず、カテゴリに確実に含まれる 1 つの例セットと、間違いなく存在しない別の例セットを提供することから始めます。 Microsoft Purview はこれらの例を処理し、分類子は、特定の項目が構築中のカテゴリに分類されるかどうかを予測します。 次に、結果を確認し、真陽性、真陰性、偽陽性、偽陰性を並べ替えて、予測の精度を高めます。
分類子を発行すると、SharePoint、Exchange、OneDrive などの場所のアイテムを並べ替え、コンテンツを分類します。
たとえば、次のトレーニング可能な分類子を作成できます。
- 法的書類 - 弁護士クライアント特権、決算セット、作業明細書など
- 戦略的ビジネスドキュメント - プレスリリース、合併と買収、取引、ビジネスまたはマーケティング計画、知的財産、特許、設計ドキュメントなど
- 価格情報 - 請求書、価格見積もり、作業指示書、入札ドキュメントなど
- 財務情報 - 組織の投資、四半期または年次の結果など
カスタム分類子を作成するためのプロセス フロー
次のフロー図は、リテンション ポリシーや通信監督など、コンプライアンス ソリューションで使用する分類子を作成して公開するプロセスを示しています。 カスタムトレーニング可能な分類子の作成の詳細については、「 トレーニング可能な分類子の概要」を参照してください。
ヒント
シード データの新しい SharePoint サイトとフォルダーを作成する場合は、そのシード データを使用するトレーニング可能な分類子を作成する前に、その場所のインデックスを作成するために少なくとも 1 時間を許可します。
分類子の再トレーニング
公開されたカスタム分類子の再トレーニングはサポートされなくなりました。 発行したトレーニング可能な分類子の精度を向上させる必要がある場合は、分類子を削除し、 より大きなサンプル セットからやり直します。
発行されていない分類子の精度を向上させるには、テスト結果を確認し、追加のデータでデータ セットを更新し、トレーニングを再開します。