共用方式為


模型自訂 (4.0 版預覽版)

重要

這項功能現在已被取代。 在 2025 年 3 月 31 日,Azure AI 影像分析 4.0 自定義影像分類、自定義物件偵測和產品辨識預覽 API 將會淘汰。 在此日期之後,對這些服務的 API 呼叫將會失敗。

若要維持模型的順暢作業,請轉換至現已正式推出的 Azure AI 自訂視覺。 自訂視覺提供與這些淘汰功能類似的功能。

模型自訂可讓您針對自己的使用案例定型特殊化影像分析模型。 自訂模型可以執行影像分類 (標籤套用至整個影像) 或物件偵測 (標籤套用至影像的特定區域)。 建立並定型自訂模型之後,模型即屬於您的視覺資源,而且您可以使用分析影像 API 來呼叫它。

遵循快速入門,快速又輕鬆地實作模型自訂:

重要

您可以使用自訂視覺服務或具有模型自訂的影像分析 4.0 服務來定型自訂模型。 下表提供這兩種服務的比較。

區域 自訂視覺服務 影像分析 4.0 服務
工作 影像分類
物件偵測
影像分類
物件偵測
基本模型 CNN 轉換器模型
標記 Customvision.ai AML Studio
入口網站 Customvision.ai Vision Studio
程式庫 REST,SDK REST,Python 範例
所需的最小定型資料 每個類別 15 個影像 每個類別 2-5 個影像
訓練資料儲存體 上傳至服務 客戶的 Blob 儲存體帳戶
模型裝載 雲端和邊緣 僅限雲端裝載、邊緣容器裝載即將推出
AI 品質
內容影像分類
(精確度第一名,22 個資料集)
物件偵測
(mAP@50,59 個資料集)
2 張拍攝51.4733.3
3 張拍攝56.7337.0
5 張拍攝63.0143.4
10 張拍攝68.9554.0
完整85.2576.6
內容影像分類
(精確度第一名,22 個資料集)
物件偵測
(mAP@50,59 個資料集)
2 張拍攝73.0249.2
3 張拍攝75.5161.1
5 張拍攝79.1468.2
10 張拍攝81.3175.0
完整90.9885.4
定價 自訂視覺定價 影像分析價格

情節元件

模型自訂系統的主要元件是定型影像、COCO 檔案、資料集物件和模型物件。

定型影像

您的一組定型影像應該包含您想要偵測的每個標籤範例。 您也會想要收集一些額外的影像,來測試已定型的模型。 影像必須儲存在 Azure 儲存體容器中,才能供模型存取。

若要有效地定型您的模型,可使用有不同視覺效果的影像。 選取有下列各種變化的影像:

  • 攝影機角度
  • 光源
  • 背景
  • 視覺效果樣式
  • 單一/群組對象
  • size
  • type

此外,請確定所有的訓練映像符合下列準則:

  • 影像必須以 JPEG、PNG、GIF、BMP、WEBP、ICO、TIFF 或 MPO 格式呈現。
  • 影像的檔案大小必須小於 20 MB。
  • 影像的維度必須大於 50 x 50 像素,且小於 16,000 x 16,000 像素。

COCO 檔案

COCO 檔案會參考所有定型影像,並將其與其標籤資訊建立關聯。 在物件偵測的情況下,其會指定每個影像上每個標籤的周框方塊座標。 此檔案必須是 COCO 格式,這是 JSON 檔案的特定類型。 COCO 檔案應該儲存在與定型影像相同的 Azure 儲存體容器中。

提示

關於 COCO 檔案

COCO 檔案是具有特定必要欄位的 JSON 檔案:"images""annotations""categories"。 範例 COCO 檔案看起來會像這樣:

{
 "images": [
   {
     "id": 1,
     "width": 500,
     "height": 828,
     "file_name": "0.jpg",
     "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/0.jpg"
   },
    {
      "id": 2,
      "width": 754,
      "height": 832,
      "file_name": "1.jpg",
      "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/1.jpg"
    },

   ...

  ],
  "annotations": [
    {
      "id": 1,
      "category_id": 7,
      "image_id": 1,
      "area": 0.407,
      "bbox": [
        0.02663142641129032,
        0.40691584277841153,
        0.9524163571731749,
        0.42766634515266866
      ]
    },
    {
      "id": 2,
      "category_id": 9,
      "image_id": 2,
      "area": 0.27,
      "bbox": [
        0.11803319477782331,
        0.41586723392402375,
        0.7765206955096307,
        0.3483334397217212
      ]
    },
    ...

  ],
  "categories": [
    {
      "id": 1,
      "name": "vegall original mixed vegetables"
    },
    {
      "id": 2,
      "name": "Amy's organic soups lentil vegetable"
    },
    {
      "id": 3,
      "name": "Arrowhead 8oz"
    },

    ...

  ]
}

COCO 檔案欄位參考

如果您要從頭開始產生自己的 COCO 檔案,請確定所有必要的欄位都已填入正確的詳細資料。 下表描述 COCO 檔案中的每個欄位:

"images"

機碼 類型 描述 是必要的嗎?
id 整數 唯一影像識別碼,從 1 開始 Yes
width 整數 以像素為單位的影像寬度 Yes
height 整數 以像素為單位的影像高度 Yes
file_name string 影像的唯一名稱 Yes
absolute_urlcoco_url string 作為 Blob 容器中 Blob 絕對 URI 的影像路徑。 視覺資源必須具有讀取註釋檔案和所有參考影像檔案的權限。 Yes

absolute_url 的值可以在 Blob 容器的屬性中找到:

絕對 URL

"annotations"

機碼 類型 描述 是必要的嗎?
id 整數 註釋的識別碼 Yes
category_id 整數 categories 區段中定義的類別識別碼 Yes
image_id 整數 影像的識別碼 Yes
area 整數 'Width' x 'Height' 的值 (bbox 的第三和第四個值) No
bbox list[float] 周框方塊的相對座標 (0 到 1),順序為 'Left'、'Top'、'Width'、'Height' Yes

"categories"

機碼 類型 描述 是必要的嗎?
id 整數 每個類別的唯一識別碼 (標籤類別)。 這些應該會出現在 annotations 區段中。 Yes
name string 類別的名稱 (標籤類別) Yes

COCO 檔案驗證

您可以使用我們的 Python 範例程式碼來檢查 COCO 檔案的格式。

資料集物件

資料集物件是由影像分析服務所儲存的資料結構,會參考關聯檔案。 您必須先建立資料集物件才能建立和定型模型。

模型物件

模型物件是影像分析服務所儲存的資料結構,代表自訂模型。 其必須與資料集相關聯才能進行初始定型。 定型之後,您可以在分析影像 API 呼叫model-name 查詢參數中輸入模型的名稱來查詢模型。

配額限制

下表說明自訂模型專案的規模限制。

類別 泛型影像分類器 泛型物件偵測器
最大定型時數 288 (12 天) 288 (12 天)
最大定型影像數 1,000,000 200,000
最大評估影像數 100,000 100,000
最小每個類別的定型影像數 2 2
最大每個影像的標籤數 1 N/A
每個影像的最大區域數 N/A 1,000
最大類別數 2,500 1,000
最小類別數 2 1
最大影像大小 (定型) 20 MB 20 MB
最大影像大小 (預測) 同步處理:6 MB、批次:20 MB 同步處理:6 MB、批次:20 MB
最大影像寬度/高度 (定型) 10,240 10,240
最小影像寬度/高度 (預測) 50 50
可用區域 美國西部 2、美國東部、西歐 美國西部 2、美國東部、西歐
接受的影像類型 jpg、png、bmp、gif、jpeg jpg、png、bmp、gif、jpeg

常見問題集

為什麼從 Blob 儲存體匯入時,我的 COCO 檔案匯入失敗?

目前,Microsoft 正在解決在 Vision Studio 中起始時,導致 COCO 檔案匯入因大型資料集而失敗的問題。 若要使用大型資料集來訓練,建議您改用 REST API。

為什麼定型需要的時間比我指定的預算更長/更短?

指定的定型預算是校正的計算時間,而不是時鐘時間。 一些差異的常見原因列出如下:

  • 超過指定的預算:

    • 影像分析遇到高定型流量,而 GPU 資源可能吃緊。 您的作業可能會在佇列中等候,或在定型期間保留。
    • 後端定型程序發生非預期的失敗,導致重試邏輯。 失敗的執行不會耗用您的預算,但這可能會導致定型時間通常較長。
    • 您的資料會儲存在與您視覺資源不同的區域中,這會導致資料傳輸時間更長。
  • 比指定的預算更短:下列因素可加速定型,但代價是在特定時鐘時間內使用更多預算。

    • 影像分析有時會根據您的資料使用多個 GPU 進行定型。
    • 影像分析有時會同時在多個 GPU 上定型多個探索試驗。
    • 影像分析有時會使用頂級 (更快) GPU SKU 來定型。

為什麼我的定型失敗,以及我應該怎麼做?

以下是定型失敗的一些常見原因:

  • diverged:定型無法從您的資料學習有意義的內容。 一些常見的原因如下:
    • 資料不足:提供更多資料應該會有所幫助。
    • 資料品質不佳:檢查您的影像是否為低解析度、極端外觀比例,或註釋是否錯誤。
  • notEnoughBudget:您指定的預算不足以容納您要定型的資料集和模型類型大小。 指定較大的預算。
  • datasetCorrupt:這通常表示您提供的影像無法存取,或註釋檔案的格式不正確。
  • datasetNotFound:找不到資料集
  • unknown:這可能是後端問題。 請連絡支援以進行調查。

哪些計量可用來評估模型?

使用的計量如下:

  • 影像分類:平均精確度、最高精確度、精確度前 5 名
  • 物件偵測:平均值平均精確度 @ 30,平均值平均精確度 @ 50,平均值平均精確度 @ 75

為什麼我的資料集註冊失敗?

API 回應應該有足夠的資訊。 畫面如下:

  • DatasetAlreadyExists;已有同名的資料集
  • DatasetInvalidAnnotationUri:「在資料集註冊期間,註釋 URI 中提供了無效 URI。

合理/良好/最佳模型品質需要多少影像?

儘管 Florence 模型具有絕佳的少樣本功能 (在有限的資料可用性下達成優異的模型效能),但一般而言更多的資料可讓定型的模型變得更好且更可靠。 某些案例只需少量資料 (例如分類蘋果與香蕉),但其他案例則需要更多資料 (例如在雨林中偵測 200 種昆蟲)。 因此很難提供單一建議。

如果您的資料標記預算受到限制,我們建議的工作流程是重複下列步驟:

  1. 針對每個類別收集 N 個影像,其中您可以輕鬆收集 N 個影像 (例如 N=3 個)

  2. 定型模型,並在您的評估集上進行測試。

  3. 如果模型效能為:

    • 夠好 (效能優於預期或效能接近您先前的實驗,且收集的資料較少):請在這裡停止並使用此模型。
    • 不佳 (效能仍低於預期或優於先前的實驗,且以合理邊界收集較少的資料):
    • 針對每個類別收集更多影像,一個您可以輕鬆收集到的數字,然後返回步驟 2。
    • 如果您注意到效能不會在幾次反覆項目之後進一步改善,則可能是因為:
      • 此問題未妥善定義或太困難。 請與我們連絡以進行個案分析。
      • 定型資料的品質可能很低:檢查是否有錯誤的註釋或像素非常低的影像。

我應該指定多少定型預算?

您應該指定願意耗用的預算上限。 影像分析會在其後端使用 AutoML 系統來試用不同的模型並定型配方,以找出最適合您使用案例的模型。 指定的預算愈多,找到更好模型的機會就愈高。

如果 AutoML 系統認為不需要再試一次,則也會自動停止,即使仍有剩餘的預算也一樣。 因此,其不一定會耗盡您指定的預算。 您保證不需要支付超過指定預算的費用。

我可以在定型中控制超參數或使用自己的模型嗎?

否,影像分析模型自訂服務會使用低程式碼 AutoML 定型系統,以處理後端中的超參數搜尋和基底模型選取。

我可以在定型之後匯出模型嗎?

預測 API 僅透過雲端服務受到支援。

為什麼我的物件偵測模型評估失敗?

可能的原因如下:

  • internalServerError:發生未知的錯誤。 請稍後再試一次。
  • modelNotFound:找不到指定的模型。
  • datasetNotFound:找不到指定的資料集。
  • datasetAnnotationsInvalid:嘗試下載或剖析與測試資料集相關聯的基礎事實註釋時發生錯誤。
  • datasetEmpty:測試資料集未包含任何「基礎事實」註釋。

使用自訂模型之預測的預期延遲為何?

我們不建議您將自訂模型用於業務關鍵環境,因為潛在的高延遲。 當客戶在 Vision Studio 中定型自訂模型時,這些自訂模型屬於其定型來源的 Azure AI 視覺資源,且客戶可以使用分析影像 API 呼叫這些模型。 當其進行這些呼叫時,自訂模型會載入記憶體中,並初始化預測基礎結構。 發生此情況時,客戶在接收預測結果時可能會遇到高於預期的延遲。

資料隱私權和安全性

如同所有 Azure AI 服務,使用影像分析模型自訂的開發人員應該了解 Microsoft 對客戶資料的原則。 請參閱 Microsoft 信任中心上的 Azure AI 服務頁面以深入了解。

下一步

建置和定型自訂模型