개체 검색 인사이트 가져오기
개체 감지
Azure AI Video Indexer는 자동차, 핸드백, 배낭, 랩톱 등의 비디오에서 개체를 검색합니다.
지원되는 개체
- airplane
- 사과
- backpack
- 바나나
- 야구 글러브
- bed
- bench
- 자전거
- boat
- book
- 병
- 볼
- 브로콜리
- 버스
- 케이크
- 차량
- 당근
- 휴대 전화
- 의자
- clock
- 컴퓨터 마우스
- 소파
- 컵
- 식탁
- donut
- fire hydrant
- 포크
- 프리스비
- 드라이어
- 핸드백
- 핫도그
- Keyboard
- 연
- 칼
- 노트북
- 전자레인지
- 오토바이
- 컴퓨터 마우스
- 넥타이
- orange
- 오븐
- parking meter
- 피자
- 화분
- sandwich
- scissors
- sink(싱크)
- 스케이트보드
- 스키
- 스노보드
- 숟가락
- 스포츠 공
- stop sign
- 옷가방
- 서핑 보드
- 테디 베어
- 테니스 라켓
- 토스터
- 화장실
- 칫솔
- traffic light
- 학습(train)
- umbrella
- 꽃병
- 와인 잔
웹 포털을 사용하여 인사이트 JSON 보기
비디오를 업로드하고 인덱싱한 후에는 웹 포털을 사용하여 JSON 형식으로 인사이트를 다운로드할 수 있습니다.
- 라이브러리 탭을 선택합니다.
- 작업할 미디어를 선택합니다.
- 다운로드 및 인사이트(JSON)를 선택합니다. JSON 파일이 새 브라우저 탭에서 열립니다.
- 예제 응답에 설명된 키 쌍을 찾습니다.
API 사용
예제 응답
검색되고 추적된 개체는 다운로드 한 insights.json 파일의 "검색된 개체" 아래에 표시됩니다. 고유 개체가 감지될 때마다 ID가 지정됩니다. 해당 개체도 추적됩니다. 즉, 모델에서 감지된 개체가 프레임으로 돌아가도록 감시합니다. 이렇게 하면 다른 인스턴스가 시작 및 종료 시간이 다른 개체의 인스턴스에 추가됩니다.
이 예제에서는 첫 번째 자동차가 감지되었고 첫 번째 개체도 감지되었으므로 ID가 1로 지정되었습니다. 그런 다음, 다른 자동차가 감지되었고 23번째 개체가 감지되었으므로 ID가 23으로 지정되었습니다. 나중에 첫 번째 자동차가 다시 나타나고 다른 인스턴스가 JSON에 추가되었습니다. 결과 JSON은 다음과 같습니다.
detectedObjects: [
{
id: 1,
type: "Car",
thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
displayName: "car",
wikiDataId: "Q1420",
instances: [
{
confidence: 0.468,
adjustedStart: "0:00:00",
adjustedEnd: "0:00:02.44",
start: "0:00:00",
end: "0:00:02.44"
},
{
confidence: 0.53,
adjustedStart: "0:03:00",
adjustedEnd: "0:00:03.55",
start: "0:03:00",
end: "0:00:03.55"
}
]
},
{
id: 23,
type: "Car",
thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
displayName: "car",
wikiDataId: "Q1420",
instances: [
{
confidence: 0.427,
adjustedStart: "0:00:00",
adjustedEnd: "0:00:14.24",
start: "0:00:00",
end: "0:00:14.24"
}
]
}
]
Key | 정의 |
---|---|
ID | 미디어 파일에서 감지된 개체의 ID 증분 수 |
Type | 개체 형식(예: 자동차) |
ThumbnailID | 개체의 단일 감지를 나타내는 GUID |
displayName | VI 포털 환경에 표시할 이름 |
WikiDataID | WikiData 구조의 고유 식별자 |
인스턴스 | 추적된 모든 인스턴스 목록 |
신뢰 | 개체 감지 신뢰도를 나타내는 0~1 사이의 점수 |
adjustedStart | 편집기를 사용할 때 조정된 비디오 시작 시간 |
adjustedEnd | 편집기를 사용할 때 조정된 비디오 종료 시간 |
start | 개체가 프레임에 표시되는 시간 |
end | 개체가 프레임에 더 이상 표시되지 않는 시간 |
구성 요소
개체 검색에 대한 구성 요소가 정의되지 않았습니다.
투명성 메모
Important
모든 VI 기능에 대한 투명도 참고 개요를 읽는 것이 중요합니다. 각 인사이트에는 자체의 투명성 메모도 있습니다.
- 표준 및 고급 처리를 위해 프레임당 최대 20개의 검색과 클래스당 35개의 트랙이 있습니다.
- 개체 크기는 프레임의 90%를 초과해서는 안 됩니다. 프레임의 상당 부분에 걸쳐 일관되게 확장되는 매우 큰 개체는 인식되지 않을 수 있습니다.
- 작거나 흐릿한 개체는 감지하기 어려울 수 있습니다. 누락되거나 잘못 분류될 수 있습니다(와인 잔, 컵).
- 일시적이고 매우 적은 프레임에 나타나는 개체는 인식되지 않을 수 있습니다.
- 개체 감지의 정확도에 영향을 줄 수 있는 다른 요인으로는 저조도 조건, 카메라 동작 및 폐색이 있습니다.
- Azure AI Video Indexer는 실제 개체만 지원합니다. 애니메이션 또는 CGI는 지원되지 않습니다. 컴퓨터에서 생성된 그래픽(예: 뉴스 스티커)은 이상한 결과를 생성할 수 있습니다.
- 바인더, 브로슈어 및 기타 서면 자료는 "책"으로 감지되는 경향이 있습니다.