收集影像
若要將物件偵測模型定型以辨識物件,您必須收集包含這些物件的影像。 遵循影像數量與品質的指導方針以取得更好的結果。
格式和大小
提供給物件偵測模型的影像需要下列特性:
格式:
- JPG
- PNG
- BMP
大小:
- 定型最大 6MB
- 256 x 256 象素的最小寬度/高度
資料數量和資料餘額
務必上傳足夠的影像來將您的 AI 模型定型。 定型集的每個物件一開始最好有至少 15 個影像。 在使用較少影像的情況下,您的模型很可能會學習到實際上是雜訊或不相關的概念。 使用更多的影像來為模型定型應該能提高準確度。
另一個考量是讓資料之間能達到平衡。 如果您針對某個物件有 500 個影像,但對於另一個物件只有 50 個影像,您的定型資料集將會不平衡。 這可能會導致模型比較能夠辨識其中一個物件。 若要取得較一致的結果,請在具有最少影像及最多影像的物件之間,保持至少 1:2 的比例。 例如,如果影像數量最多的物件有 500 個影像,那麼影像數量最少的物件應該至少要有 250 個影像用於定型。
使用更多樣化的影像
提供能代表人們會在正常使用期間提交給模型的影像。 例如,假設您正在將模型定型以辨識蘋果。 如果您只使用位於盤子上之蘋果的影像來定型,模型可能無法一致地辨識位於樹上的蘋果。 包括不同種類的影像將能確保您的模型不會產生偏差,而且能適當地一般化。 下列是一些可讓您的定型集更加多樣化的方法。
背景
在不同背景前面使用您的物件的影像,例如,盤子、雙手和樹木上的水果。 呈現相關內容的相片能為分類器提供更多資訊,因此它們比背後為中性背景的相片更好。
光源
使用具有不同光源的定型影像,特別是在用於偵測的影像可能會具有不同光源的情況下。 例如,包含使用閃光燈、高曝光等方式拍攝的影像。 包含具有不同飽和度、色調及亮度的影像也會很有幫助。 您的裝置相機可能會讓您控制這些設定。
物件大小
擷取物件的不同部分以提供有各種不同大小物件的影像,例如數串香蕉的相片和一根香蕉的特寫。 不同的大小可協助模型更適當地一般化。
攝影機角度
嘗試提供從不同角度拍攝的影像。 如果您所有相片都是來自一組固定的相機 (例如監視攝影機),請為每個相機指派不同的標籤。 這可協助避免將不相關的物件 (例如路燈) 模型化為重要特徵。 即使所有相機都是拍攝相同的物件,也請為其指派相機標籤。
非預期的結果
AI 模型可能會錯誤地學習您影像所具備的共同特性。 假設您想要建立能夠區分蘋果和柑橘的模型。 如果您使用位於手中的蘋果與位於白盤上柑橘的影像,模型可能會以手與白盤來定型,而不是蘋果與柑橘。
若要更正此問題,請使用上述指引搭配更多樣化的影像來定型:提供具有不同角度、背景、物件大小、群組及其他變化的影像。