開始使用可訓練分類器
Microsoft Purview 可訓練分類器是一種工具,可讓您藉由提供要查看的範例來定型以辨識各種類型的內容。 定型之後,您可以使用它來識別 Office 敏感度標籤、通訊合規性原則和保留卷標原則的應用專案。
實作自定義可訓練分類器需要兩個步驟:
- 提供人類) 所選取的兩組範例數據 (。
- 只包含屬於類別目錄之專案的集合。
- 只包含 不 屬於類別目錄之專案的集合。
- 測試分類器偵測相符專案的能力。
本文說明如何建立和測試自定義分類器。
若要深入瞭解不同類型的分類器,請參 閱瞭解可訓練分類器。
提示
如果您不是 E5 客戶,請使用 90 天Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據。
必要條件
授權需求
分類器是 Microsoft 365 E3 和 E5 合規性的一項功能。 您必須有其中一個訂用帳戶才能使用它們。
權限
若要在下列案例中使用分類器,您需要下列許可權:
案例 | 必要的角色許可權 |
---|---|
保留標籤原則 | 記錄管理 保留管理 |
敏感度標籤原則 | 安全性系統管理員 合規性系統管理員 合規性資料系統管理員 |
通訊合規性政策 | 測試人員風險管理系統管理員 主管檢閱系統管理員 |
重要事項
根據預設,只有建立自定義分類器的用戶可以訓練和檢閱該分類器所做的預測。
為自訂可訓練分類器進行準備
在您深入瞭解之前,瞭解建立自定義可訓練分類器所涉及的內容會很有説明。
整體工作流程
若要深入瞭解建立自定義可訓練分類器的整體工作流程,請參閱 建立自定義可訓練分類器的程式流程。
種子內容
若要確保可訓練分類器可以獨立且精確地識別某個專案屬於特定類別的內容,您必須提供該類別中內容類型的許多範例。 將樣本饋送至可訓練分類器稱為 植入。 人類必須是選取種子內容的物件,而且該內容必須包含兩組數據:一組只包含強代表分類器設計來偵測 (正樣本) 的內容的專案,以及第二組明確不屬於 (負面樣本) 的專案。
至少需要 50 個正面樣本 (最多 500 個) ,而且至少需要 150 個負樣本 (最多 1500 個) 才能定型分類器。 您提供的範例越多,分類器所做的預測就越精確。 可訓練分類器會依檔案建立的日期/時間戳) ,處理最多 2000 個最近建立的範例 (。
提示
為了獲得最佳結果,您的測試範例集中至少有 200 個專案,其中包含至少 50 個正面範例和至少 150 個負面範例。
如何建立可訓練分類器
針對您使用的入口網站選取適當的索引標籤。 視您的Microsoft 365 方案而定,Microsoft Purview 合規性入口網站 即將淘汰或即將淘汰。
若要深入瞭解 Microsoft Purview 入口網站,請 參閱 Microsoft Purview 入口網站。 若要深入瞭解合規性入口網站,請參閱 Microsoft Purview 合規性入口網站。
預覽版: 下列程式會自動測試可訓練分類器,並將建立工作流程從12天縮短為兩天。 (在某些情況下,此程式只需要幾個小時的時間。)
收集 50-500 個種子內容專案,這些項目強烈表示您希望分類器正面識別為在類別中的數據。 如需支援的文件類型清單,請參閱 SharePoint Server 中的預設編目擴展名和剖析的文件類型。
從 150 - 1500 個專案收集 第二 組種子內容 (,) 代表 不 屬於類別的數據。
將正和負種子內容放在不同的 SharePoint 資料夾中。 每個資料夾都必須專用於只保留 種子內容。 記下每個集合的網站、文檔庫和資料夾URL。
提示
如果您為種子數據建立新的 SharePoint 網站和資料夾,請在建立將使用該種子數據的可訓練分類器之前,至少允許為該位置編製索引一小時。
使用合規性系統管理員或安全性系統管理員角色存取權登入 Microsoft Purview 入口網站或 Microsoft Purview 合規性入口網站,然後流覽至數據外洩防護>數據分類>分類器。
選擇 [ 可訓練分類器] 索引標籤 。
選擇 [建立可訓練分類器]。
新增 正面 範例的來源:針對分類器應該偵測到的種子內容選取 SharePoint 網站、文檔庫和資料夾 URL,然後選擇 [ 下一步]。
新增 負面 範例的來源:針對分類器應該忽略的種子內容選取 SharePoint 網站、文檔庫和資料夾 URL,然後選擇 [ 下一步]。
檢閱設定,然後選擇 [建立可訓練分類器]。
在24小時或更短的時間內,可訓練分類器會處理種子數據並建立預測模型。 在處理種子資料時,分類器狀態為 [進行中]。 當分類器完成處理種子數據時,[定型] 的狀態會變更為 完成,而且專案已經過測試。
一旦定型完成且專案已 (自動) 測試后,請選擇 [ 發佈] 來發佈分類器以供使用。
發佈之後,您的分類器會在 Office 自動套用標籤與敏感度標籤、根據條件和通訊合規性自動套用保留標籤原則中作為條件使用。
測試分類器
一旦可訓練分類器處理足夠的正面和負數樣本本來建置預測模型之後,您就必須測試其所做的預測。 在測試分類器時,您會確認其預測是否正確。 處理所有數據之後,請手動查看結果,並確認每個預測是否正確、不正確,或您不確定。 Microsoft在匯總中使用此意見反應來改善預測模型。