얼굴 감지, 특성 및 입력 데이터
주의
Face 서비스 액세스는 책임 있는 AI 원칙을 지원하기 위해 자격 및 사용 기준에 따라 제한됩니다. Face 서비스는 Microsoft 관리 고객 및 파트너만 사용할 수 있습니다. 얼굴 인식 접수 양식을 사용하여 액세스를 적용합니다. 자세한 내용은 얼굴 제한 액세스 페이지를 참조하세요.
Important
얼굴 특성은 통계 알고리즘 사용을 통해 예측됩니다. 항상 정확하지는 않을 수 있습니다. 특성 데이터를 기준으로 결정을 내릴 때는 주의해야 합니다. 스푸핑 방지를 위해 이러한 특성을 사용하지 마세요. 대신 얼굴 생체 검색을 사용하는 것이 좋습니다. 자세한 내용은 자습서: 얼굴의 생동감 검색을 참조하세요.
이 문서에서는 얼굴 감지 및 얼굴 특성 데이터의 개념을 설명합니다. 얼굴 감지는 이미지에서 사람 얼굴을 찾고 필요에 따라 여러 종류의 얼굴 관련 데이터를 반환하는 프로세스입니다.
감지 API를 사용하여 이미지에서 얼굴을 감지합니다. REST API 또는 클라이언트 SDK 사용을 시작하려면 Face 서비스 빠른 시작을 따릅니다. 또는 자세한 가이드는 감지 API 호출을 참조하세요.
얼굴 사각형
검색된 각 얼굴은 응답의 faceRectangle 필드에 해당합니다. 이는 감지된 얼굴의 왼쪽, 위쪽, 너비, 높이에 대한 픽셀 좌표 세트입니다. 이 좌표를 사용하여 얼굴의 위치와 크기를 확인할 수 있습니다. API 응답에서 얼굴은 가장 큰 크기에서 가장 작은 크기 순으로 나열됩니다.
Azure AI Vision Studio를 사용하여 얼굴 감지 기능을 빠르고 쉽게 사용해 보세요.
얼굴 ID
얼굴 ID는 이미지에서 감지된 각 얼굴에 대한 고유 식별자 문자열입니다. Face ID에는 제한된 액세스 승인이 필요하며, 이는 접수 양식을 작성하여 신청할 수 있습니다. 자세한 내용은 Face API 제한된 액세스 페이지를 참조하세요. 감지 API 호출에서 얼굴 ID를 요청할 수 있습니다.
얼굴 이정표
얼굴 랜드마크는 눈동자나 코끝과 같이 얼굴에서 찾기 쉬운 지점의 집합입니다. 기본적으로 27개의 이정표 지점이 사전 정의되어 있습니다. 다음 그림은 27개의 지점을 모두 보여줍니다.
지점의 좌표는 픽셀 단위로 반환됩니다.
Detection_03 모델에는 현재 가장 정확한 랜드마크 검색 기능이 있습니다. 반환하는 눈과 동공 랜드마크는 얼굴의 시선 추적을 가능하게 할 만큼 정확합니다.
특성
주의
Microsoft는 감정 상태 및 신원 특성을 추론하는 데 사용할 수 있는 얼굴 인식 기능 중 오용될 경우 사람들이 고정 관념, 차별 또는 불공정한 서비스 거부를 겪는 원인이 될 수 있는 기능을 중단하거나 제한했습니다. 사용 중지된 기능은 감정과 성별입니다. 제한된 기능으로는 나이, 미소, 수염, 머리 스타일, 화장 등이 있습니다. 제한된 기능을 사용하여 이점을 얻을 수 있으며 책임감 있게 사용할 수 있는 시나리오가 있는 경우 Azure Face API에 이메일을 보내세요. 여기에서 이 결정에 대해 자세히 알아봅니다.
특성은 감지 API를 이용하여 선택적으로 감지할 수 있는 특징의 집합입니다. 다음과 같은 특성이 감지될 수 있습니다.
액세서리: 지정된 얼굴에 액세서리가 있는지 여부를 나타냅니다. 이 특성은 모자, 안경 및 마스크를 포함한 가능한 액세서리를 반환하며, 각 액세서리에 대해 신뢰도 점수는 0에서 1 사이입니다.
흐림: 이미지에서 얼굴의 흐림을 나타냅니다. 이 특성은 0과 1 사이의 값을 반환하고 낮음, 보통, 높음의 비공식적 등급을 반환합니다.
노출: 이미지에서 얼굴 노출을 나타냅니다. 이 특성은 0에서 1 사이의 값과 underExposure, goodExposure 또는 overExposure의 비공식 등급을 반환합니다.
안경: 지정된 얼굴에 안경이 있는지 여부를 나타냅니다. 가능한 값은 NoGlasses, ReadingGlasses, 선글라스 및 수영 고글입니다.
머리 포즈: 3D 공간에서 얼굴의 방향을 나타냅니다. 이 특성은 오른쪽 규칙에 따라 정의되는 롤, 요 및 피치 각도(도)로 설명됩니다. 세 각도의 순서는 롤 요 피치이며 각 각도의 값 범위는 -180도에서 +180도입니다. 얼굴의 3D 방향은 롤, 요 및 피치 각도의 순서로 추정됩니다. 각도 매핑에 대해서는 다음 다이어그램을 참조하세요.
이러한 값을 사용하는 방법에 대한 자세한 내용은 HeadPose 특성 사용을 참조 하세요.
마스크: 얼굴이 마스크를 쓰고 있는지 여부를 나타냅니다. 이 특성은 가능한 마스크 형식과 코와 입이 가려졌는지 여부를 나타내는 부울 값을 반환합니다.
노이즈: 얼굴 이미지에서 감지된 시각적 노이즈를 나타냅니다. 이 특성은 0에서 1 사이의 값과 낮음, 중간 또는 높음의 비공식적인 등급을 반환합니다.
폐색: 얼굴 부분을 차단하는 개체가 있는지 여부를 나타냅니다. 이 특성은 eyeOccluded, foreheadOccluded 및 mouthOccluded에 대한 부울 값을 반환합니다.
QualityForRecognition: 검색에 사용되는 이미지가 얼굴 인식을 시도할 수 있는 충분한 품질인지 여부를 결정하는 전체 이미지 품질을 나타냅니다. 값은 낮음, 중간 또는 높음의 비공식 등급입니다. 개인 등록에는 고품질 이미지만 권장되며, 식별 시나리오에서는 중간 이하의 품질이 권장됩니다.
참고 항목
각 특성의 가용성은 지정된 검색 모델에 따라 다릅니다. QualityForRecognition 특성은 인식 모델 detection_01 또는 detection_03 조합을 사용하는 경우에만 현재 사용할 수 있으므로 인식 모델과 인식 모델 recognition_03 또는 recognition_04 따라 달라집니다.
입력 요구 사항
다음과 같은 팁을 사용하여 입력 이미지가 가장 정확한 감지 결과를 제공하는지 확인합니다.
- 지원되는 입력 이미지 형식은 JPEG, PNG, GIF(첫 번째 프레임), BMP입니다.
- 이미지 파일 크기는 6MB를 넘지 않아야 합니다.
- 감지 가능한 최소 얼굴 크기는 1920 x 1080 픽셀보다 크지 않은 이미지에서 36 x 36 픽셀입니다. 1920 x 1080 픽셀보다 큰 이미지에서는 최소 얼굴 크기가 비례하여 더 큽니다. 얼굴 크기를 줄이면 일부 얼굴이 감지 가능한 최소 얼굴 크기보다 크더라도 감지되지 않을 수 있습니다.
- 감지 가능한 최대 얼굴 크기는 4096 x 4096 픽셀입니다.
- 36 x 36 ~ 4096 x 4096 픽셀의 크기 범위를 벗어나는 얼굴은 감지되지 않습니다.
방향 정보가 포함된 입력 데이터
JPEG 형식의 일부 입력 이미지에는 EXIF(교환 가능한 이미지 파일 형식) 메타데이터의 방향 정보가 포함될 수 있습니다. EXIF 방향을 사용할 수 있는 경우 얼굴 감지를 위해 보내기 전에 이미지가 자동으로 올바른 방향으로 회전됩니다. 회전된 이미지를 기반으로 감지된 각 얼굴의 얼굴 직사각형, 랜드마크, 머리 자세를 추정합니다.
얼굴 사각형과 랜드마크을 올바르게 표시하려면 이미지가 올바르게 회전하는지 확인해야 합니다. 대부분의 이미지 시각화 도구는 기본적으로 EXIF 방향에 따라 이미지를 자동으로 회전합니다. 다른 도구의 경우 사용자 고유의 코드를 사용하여 회전을 적용해야 할 수 있습니다. 다음 예제에서는 회전된 이미지(왼쪽)와 회전되지 않은 이미지(오른쪽)의 얼굴 사각형을 보여줍니다.
동영상 입력
비디오 피드에서 얼굴을 감지하는 경우 비디오 카메라의 특정 설정을 조정하여 성능을 향상시킬 수 있습니다.
다듬기: 많은 비디오 카메라가 다듬기 효과를 적용합니다. 프레임 사이를 흐리게 만들고 선명도를 낮추기 때문에 가능하면 이 기능을 꺼야 합니다.
셔터 속도: 더 빠른 셔터 속도는 프레임 간의 동작 양을 줄이고 각 프레임을 더 선명하게 만듭니다. 셔터 속도는 1/60 또는 더 빠르게 권장합니다.
셔터 각도: 일부 카메라는 셔터 속도 대신 셔터 각도를 지정합니다. 가능한 경우 더 낮은 셔터 각도를 사용해야 하므로 비디오 프레임이 더 선명합니다.
참고 항목
셔터 각도가 낮은 카메라 센서는 각 프레임에서 빛을 덜 받으므로 이미지가 더 어둡게 됩니다. 사용할 적절한 수준을 결정해야 합니다.
다음 단계
이제 얼굴 감지 개념에 익숙해졌으므로 지정된 이미지에서 얼굴을 감지하는 스크립트를 작성하는 방법을 알아봅니다.