共用方式為


自訂類別 (預覽)

Azure AI 內容安全性可讓您建立及管理自己的內容類別,以增強仲裁和篩選,以符合您的特定原則或使用案例。

自訂的選項

定義及使用自定義類別的方法有很多種,本節會詳細和比較。

API 功能
自訂類別 (標準) API 使用可自訂的機器學習模型來建立、取得、查詢和刪除自訂類別。 或者,列出全部自訂類別,以取得進一步的註釋工作。
自訂類別 (快速) API 使用大型語言模型 (LLM) 快速瞭解新興內容事件中的特定內容模式。

自訂類別 (標準) API

自訂分類 (標準) API 可讓客戶定義其需求特定的分類、提供範例資料、定型自訂機器學習模型,以及使用它根據學習的類別分類新內容。

這是使用機器學習模型進行自訂的標準工作流程。 視定型資料品質而定,它可以達到非常好的效能等級,但最多可能需要數小時才能定型模型。

此實作適用於文字內容,而非影像內容。

自訂類別 (快速) API

自訂類別 (快速) API 的設計目的是比標準方法更快且更有彈性。 這能夠用於識別、分析、包含、消除和復原涉及在線平台上不當或有害內容的網路事件。

事件可能涉及一組新興的內容模式 (文字、影像或其他形式),違反 Microsoft 社群指導方針或客戶自己的原則和期望。 這些事件需要快速且準確地緩解,以避免潛在的即時網站問題或對使用者和社群造成傷害。

此實作適用於文字內容和影像內容。

提示

另一個處理新興的內容事件是使用 封鎖清單,但只允許確切的文字比對,而且沒有影像比對。 自訂類別 (快速) API 提供下列進階功能:

  • 使用內嵌搜尋搭配輕量分類器的語意文字比對
  • 影像比對與輕量型物件追蹤模型和內嵌搜尋。

運作方式

Azure AI 內容安全自訂類別功能會使用多步驟流程來建立、定型及使用自訂內容分類模型。 以下是工作流程:

步驟 1:定義和設定

您定義自訂類別時,您必須教導 AI 您想要識別的內容類型。 這牽涉到提供清楚類別名稱,以及封裝內容特性的詳細定義

然後,您會收集和 (選用) 範例的平衡資料集,以協助 AI 瞭解類別的細微差別。 此資料應該代表模型在真實案例中會遇到的各種內容。

步驟 2:模型定型

準備資料集並定義類別之後,Azure AI 內容安全服務會訓練新的機器學習模型。 此模型會使用您的定義和上傳的資料集,以使用大型語言模型執行資料擴充。 因此,定型資料集會更大且品質較高。 在定型期間,AI 模型會分析資料,並學習區分與指定的類別和內容不相符的內容。

步驟 3:模型評估

定型之後,您必須評估模型,以確保其符合您的正確性需求。 使用之前尚未收到的新內容來測試模型。 評估階段可協助您識別將模型部署至生產環境所需的任何潛在調整。

步驟 4:模型使用方式

您可以使用 analyzeCustomCategory 分析文字內容,並判斷它是否符合您定義的自訂類別。 服務會傳回布林值,指出內容是否與指定的類別對齊

限制

語言可用性

自訂類別 API 支援內容安全文字審核支援的全部語言。 請參閱語言支援

輸入限制

如需自訂類別 (標準) API 的輸入限制,請參閱下表:

Object 限制
支援的語言 僅英文
每位使用者的類別數目 3
每個類別的版本數目 3
每個類別的並行組建數目 (程序) 1
每秒的推斷作業 5
類別版本中的範例數目 正範例 (必要):最低 50,最大 5K
總計 (負範例和正範例):10K
不允許重複的範例。
範例檔案大小 最多 128000 位元組
文字範例的長度 最多 125K 個字元
類別定義的長度 最多 1000 個字元
類別名稱的長度 最多 128 個字元
Blob URL 的長度 最多 500 個字元

區域可用性

若要使用這些 API,您必須在其中一個支援的區域中建立 Azure AI 內容安全資源。 請參閱區域可用性 (英文)。

後續步驟

請遵循操作指南,使用 Azure AI 內容安全 API 建立自訂類別。