이미지 수집
개체를 인식하도록 개체 감지 모델을 학습시키려면 그러한 개체가 포함된 이미지를 수집해야 합니다. 더 나은 결과를 위해서는 이미지 수량 및 품질에 대한 지침에 따르세요.
형식 및 크기
개체 감지 모델에 제공하는 이미지는 다음과 같은 특성이 필요합니다.
형식:
- JPG
- PNG
- BMP
크기:
- 학습용 최대 6MB
- 256픽셀 x 256픽셀의 최소 너비 / 높이
데이터 수량 및 데이터 균형
AI 모델을 학습시키는 데 충분한 이미지를 업로드하는 것이 중요합니다. 처음에는 학습 집합으로 개체당 15개 이상의 이미지를 사용합니다. 이미지가 이보다 적으면 잡음이거나 관련이 없는 개념을 모델이 학습할 위험이 큽니다. 이보다 많은 이미지로 모델을 학습시키면 정확도가 향상됩니다.
또 다른 고려 사항은 데이터가 균형을 이루어야 한다는 것입니다. 어떤 개체의 이미지는 500개이고 어떤 개체의 이미지는 50개뿐이라면 학습 데이터 집합의 균형이 맞지 않습니다. 이로 인해 모델이 개체 중 어느 하나를 더 잘 인식하게 될 수 있습니다. 보다 일관된 결과를 위해서는 이미지 수가 가장 적은 개체와 이미지 수가 가장 많은 개체의 비율을 적어도 1:2로 유지하세요. 예를 들어 이미지 수가 가장 많은 개체에 500개의 이미지가 있다면 이미지 수가 가장 적은 개체의 이미지 수가 250개 이상이어야 학습 효과가 높아집니다.
보다 다양한 이미지를 사용
일반적인 사용 중에 모델에 제출될 항목을 대표하는 이미지를 제공합니다. 예를 들어 사과를 인식하도록 모델을 학습시킨다고 가정해 보겠습니다. 접시에 놓인 사과 이미지만 학습시킬 경우, 나무에 달린 사과를 일관되게 인식하지 못할 수 있습니다. 다양한 종류의 이미지를 포함하면 모델이 편향되지 않고 잘 일반화될 수 있습니다. 학습 집합을 좀 더 다양하게 만들 수 있는 몇 가지 방법은 아래와 같습니다.
배경
다른 배경 앞에 있는 사물의 이미지를 사용하십시오. 예를 들어, 접시, 손, 나무 위에 있는 과일이 있습니다. 문맥별 사진은 분류자에게 더 많은 정보를 제공하므로 중립 배경을 사용한 사진보다 더 효과적입니다.
조명
특히 감지에 사용되는 이미지의 조명이 서로 다를 수 있는 경우, 조명이 다른 학습 이미지를 사용합니다. 예를 들어 플래시를 사용하거나 노출을 높여 촬영한 이미지를 포함합니다. 또한 다양한 채도, 색상 및 밝기를 적용한 이미지를 포함하는 것이 유용합니다. 이러한 설정은 디바이스의 카메라에서 제어할 수 있을 것입니다.
개체 크기
물체의 크기가 다양한 이미지를 제공하여 물체의 다른 부분을 캡처합니다. 예를 들어, 바나나 다발 사진과 단일 바나나의 근접 촬영 사진이 있습니다. 크기가 다르면 모델이 일반화를 더 잘 수행할 수 있습니다.
카메라 각도
다양한 각도에서 찍은 이미지를 제공하세요. 모든 사진이 감시 카메라와 같은 고정 카메라 집합의 사진인 경우, 각 카메라에 서로 다른 레이블을 할당합니다. 그러면 가로등 기둥과 같이 관련이 없는 개체를 핵심 특징으로 모델링하는 결과를 피할 수 있습니다. 카메라들이 동일한 개체를 캡처하는 경우에도 카메라에 레이블을 할당하세요.
예기치 않은 결과
AI 모델은 이미지에 공통적인 특성을 잘못 학습할 수 있습니다. 사과와 감귤류를 구분하는 모델을 만들려 한다고 가정해 보겠습니다. 손에 든 사과 이미지와 흰색 접시에 담긴 감귤류의 이미지를 사용할 경우, 모델은 사과와 감귤류를 구분하도록 학습하는 대신 손과 접시를 구분하도록 학습할 수 있습니다.
이를 해결하려면 위 지침에 따라 보다 다양한 이미지로 학습을 진행하고, 다양한 각도, 배경, 물체 크기, 그룹 및 기타 변형이 적용된 이미지를 제공합니다.