提高分類器正確性
敏感 性資訊類型 (SIT) 和 可定型分類器等分類器會用於各種類型的原則,以識別敏感性資訊。 就像大多數這類模型一樣,有時候它們會將項目識別為不敏感。 或者,它們可能無法在實際狀態下將項目識別為敏感性。 這些稱為誤判和誤判。
本文說明如何確認分類器比對的專案是否為 (相符) 或誤判為真 (不是相符) ,並提供「比/對不是」比對意見反應。 您可以使用該意見反應來微調分類器,以提高精確度。 如果您想要協助提高Microsoft提供的分類器正確 性,您也可以傳送修訂版本的檔以及 Match, Not a Match 意見反應給Microsoft。
[ 比對]、 [不相符] 和 [ 內容摘要] 體驗可在下列專案中使用:
- Data Explorer - 適用於 SharePoint 網站、OneDrive 網站
- 內容總管 - 適用於 SharePoint 網站、OneDrive 網站
- 敏感性資訊類型比對項目頁面 - 適用於 SharePoint 網站、OneDrive 網站
- 可訓練分類器比對項目頁面 - 適用於 SharePoint 網站、OneDrive 網站
- Microsoft Purview 資料外洩防護 (DLP) 警示頁面 - 適用於 Exchange 中的 SharePoint 網站、OneDrive 和電子郵件
- Microsoft威脅防護 (MTP) 警示頁面 - 適用於 Exchange 中的 SharePoint 網站、OneDrive 網站和電子郵件
內容 摘要 體驗可在下列專案中取得:
- Microsoft Purview 資訊保護 (MIP) 自動套用標籤模擬比對專案 - 適用於 SharePoint 網站、OneDrive 網站
提示
如果您不是 E5 客戶,請使用 90 天Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據。
適用於
分類器 | 內容摘要 | 修訂的預覽面板 | 比對與不相符 |
---|---|---|---|
坐 | 是 | 是 | 是 |
自定義 SIT | 是 | 否 | 是 |
指紋 SIT | 否 | 否 | 是 |
完全符合 SIT 的數據 | 不* | 否 | 否 |
具名實體 | 不* | 否 | 否 |
認證掃描 | 否 | 否 | 否 |
內建可訓練分類器 | 是的** | 是 | 是 |
自定義可訓練分類器 | 否 | 否 | 是 |
* 針對 SharePoint 網站和 OneDrive 網站,MIP 自動套用標籤模擬比對專案支援這些分類器。
** 內建可訓練分類器 清單,以及支援內容摘要的清單。
重要事項
比對/不相符的意見反應和內容摘要體驗支援中的專案:SharePoint 網站 & OneDrive 網站 - 適用於內容總管、敏感性資訊類型和可訓練分類器比對專案、DLP 警示和 MTP 警示。 Exchange 中的電子郵件 - 適用於 DLP 警示和 MTP 警示。 內容摘要體驗支援中的專案:SharePoint 網站和 OneDrive 網站 - 適用於 MIP 模擬比對專案
授權和訂用帳戶
如需相關授權和訂用帳戶的相關信息,請參閱 數據分類分析的授權需求:概觀內容 & 活動總管。
已知限制
- 內容摘要只會在任何指定的項目中顯示有限數目的相符專案,而非所有相符專案。
- 內容摘要和意見反應體驗僅適用於在為租使用者啟用意見反應體驗之後所建立或更新的專案。 啟用功能之前分類的專案可能沒有可用的內容摘要和意見反應體驗。
如何評估比對精確度並提供意見反應
內容摘要體驗,其中您會指出相符專案是否為真肯定 (符合) 或誤判 (不是相符) ,在它呈現的所有位置都類似。
重要事項
您必須已將使用 SIT 或可訓練分類器的 DLP 原則部署到 OneDrive 網站、SharePoint 網站或 Exchange 信箱。 在內容 摘要 頁面中出現任何專案之前,您也必須具有相符的專案。
使用內容總管
此範例示範如何使用 [ 內容摘要 ] 索引標籤來提供意見反應。
根據您使用的入口網站,流覽至下列其中一個位置:
登入 Microsoft Purview 入口網站>解決方案>數據生命週期管理>探險 家>內容總管。
登入 Microsoft Purview 合規性入口網站>Solutions>數據分類>內容總管。
在 [篩選卷 標、資訊類型或類別] 中,輸入您想要檢查其相符專案的 SIT 或可訓練分類器名稱。
選取 SIT。
選取位置,並確定 [ 檔案 ] 數據行中有非零的值。 (唯一支援的位置是 SharePoint 和 OneDrive.)
開啟資料夾,然後選取檔。
選取檔 [ 敏感性資訊類型 ] 資料行中的連結,以查看專案相符的 SIT 和 信賴等級。
選擇 [關閉]
開啟檔,然後選取 [ 內容摘要] 索引 標籤。
檢閱專案,並確認是否相符。
如果相符,請選擇 [關閉]。 您已完成。
如果不是相符專案,請選擇 [不相符]。
如果您發生錯誤並選擇錯誤的選項,請選取 [關閉] 旁的 [撤銷意見反應]。 這會將專案放回 「不相符」/狀態 。
檢閱專案,並修訂或取消修訂任何文字。
選擇 [關閉]。
使用敏感性資訊類型比對項目頁面
您可以在 [ 敏感性資訊類型 ] 頁面中存取相同的意見反應機制。
根據您使用的入口網站,流覽至下列其中一個位置:
登入 Microsoft Purview 入口網站>解決方案>數據生命週期管理>分類>敏感性信息類型。
登入 Microsoft Purview 合規性入口網站>Solutions>數據分類>分類器>敏感性信息類型。
在 [ 搜尋] 欄位中,輸入您想要檢查其精確度的 SIT 名稱。
開啟 SIT。 這會顯示 [ 概觀] 索引 標籤。您可以在這裡查看符合的項目數目、不相符專案的計數,以及具有意見反應的項目數目。
選取 [ 相符的專案] 索引標籤 。
開啟資料夾並選取檔。 這裡僅支援 SharePoint、OneDrive 位置。 請確定 [ 檔案 ] 資料行中有非零的值。
選取專案 [ 敏感性資訊類型 ] 資料行中的連結,以查看專案相符的 SIT 和 信賴等級。
選擇 [關閉]。
開啟檔,然後選取 [ 內容摘要] 索引 標籤。
檢閱專案,並確認該專案是否相符。
如果相符,請選擇 [ 比對 ],然後選擇 [ 關閉]。
如果它不是相符專案,請選擇 [不相符]。
如果您發生錯誤並選取錯誤的選項,請選取 [關閉] 旁的 [撤銷意見反應]。 這會將專案放回 「不相符」/狀態 。
選擇 [關閉]。
使用可訓練分類器比對項目頁面
根據您使用的入口網站,流覽至下列其中一個位置:
登入 Microsoft Purview 入口網站>解決方案>數據生命週期管理>分類>可訓練分類器。
登入 Microsoft Purview 合規性入口網站>Solutions>數據分類>分類器>可訓練分類器。
選取您想要檢查其精確度的可訓練分類器。
開啟可訓練分類器。 這會顯示 [ 概觀] 索引 標籤。您可以在這裡查看符合的項目數目、不相符專案的計數,以及具有意見反應的項目數目。
選取 [ 相符的專案] 索引標籤 。
開啟資料夾並開啟檔。 這裡僅支援 SharePoint、OneDrive 位置。 請確定 [ 檔案 ] 資料行中有非零的值。
開啟檔,然後選取 [ 內容摘要] 索引 標籤。
檢閱專案,並確認該專案是否相符。
如果相符,請選擇 [ 比對 ],然後選擇 [ 關閉]。
如果它不是相符專案,請選擇 [不相符]。
如果您發生錯誤並選取錯誤的選項,請選擇 [關閉] 旁的 [撤銷意見反應]。 這會將專案放回 「不相符」/狀態 。
選擇 [關閉]。
使用數據外洩防護警示頁面
根據您使用的入口網站,流覽至下列其中一個位置:
登入 Microsoft Purview 入口網站>解決方案>數據外洩防護>警示。
登入 Microsoft Purview 合規性入口網站>Solutions>數據外洩防護>警示。
選擇警示。
選擇 [檢視詳細數據]。
選擇 [ 事件] 索 引標籤。
將 [ 詳細數據] 索引標籤 最大化。
檢閱專案,並確認該專案是否相符。
選擇 [動作]。
如果相符,請關閉視窗。 您已完成。
如果不符合,請選擇 [ 動作 ],然後選擇 [ 不相符]。
檢閱專案,並修訂或取消修訂任何文字。
關閉視窗。
使用意見反應來微調分類器
如果您的 SIT 或可訓練分類器根據意見反應傳回太多誤判,請嘗試其中一些選項加以精簡,並提高其精確度。
可訓練分類器
不再支援重新定型自定義分類器。 如果您需要改善所建立可訓練分類器的精確度,請移除分類器,並從較大的範例集開始。 如需詳細資訊, 請參閱開始使用可訓練分類器。
敏感性資訊類型
增加可判斷嚴重性的敏感性資訊類型的臨界值。 您可以針對個別分類器使用不同的閾值。
瞭解信賴等級及其定義方式。 嘗試使用低信賴度搭配高實例計數,或使用低實例計數的較高信賴等級。
複製並修改內建的 SIT 以包含其他條件,例如關鍵詞的存在、更嚴格的值比對,或更強的格式設定需求。
修改自定義 SIT 以排除已知的前置詞、後綴或模式。 例如,如果您的電子郵件簽章或文件標頭包含電話號碼,偵測電話號碼的自定義 SIT 可能會觸發每封電子郵件。 從您的自定義 SIT 排除組織的電話號碼序列,可防止針對每封電子郵件或檔觸發規則。
包含更多以字典為基礎的 SIT 作為條件,以縮小與討論相關文章之專案的相符項目範圍。 例如,比對病患診斷的規則可藉由要求出現診斷、診斷、條件、徵兆和病患等字組來增強。
針對具名實體 SIT,例如 所有全名,最好設定較高的實例計數臨界值,例如 10 或 50。 如果同時偵測到人員名稱和社會安全號碼 (SSN) ,則 SSN 很有可能是真正的 SSN,而且我們會降低原則不會觸發的風險,因為偵測到的 SSN 太少。