Image Analysis - Analyze Image
입력 이미지를 분석합니다. 요청에는 콘텐츠 형식 ['image/*', 'application/octet-stream']이 있는 이미지 스트림 또는 이미지 스트림을 검색하는 데 사용할 URL 속성이 포함된 JSON 페이로드가 포함됩니다.
POST /imageanalysis:analyze?api-version=2023-04-01-preview
POST /imageanalysis:analyze?features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview
URI 매개 변수
Name | In(다음 안에) | 필수 | 형식 | Description |
---|---|---|---|---|
api-version
|
query | True |
string |
요청된 API 버전입니다. |
features
|
query |
요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다. |
||
gender-neutral-caption
|
query |
boolean |
캡션 및 denseCaptions 기능에 대해 성 중립적 캡션을 사용하도록 설정하는 부울 플래그입니다. 이 매개 변수를 지정하지 않으면 기본값은 "false"입니다. |
|
language
|
query |
string |
출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어 목록은 https://aka.ms/cv-languages 참조하세요. |
|
model-name
|
query |
string |
사용자 지정 학습된 모델의 이름입니다. 매개 변수 "features"를 지정하지 않은 경우 이 매개 변수를 지정해야 합니다. |
|
smartcrops-aspect-ratios
|
query |
string |
smartCrops 기능에 사용할 가로 세로 비율 목록입니다. 가로 세로 비율은 대상 자르기 너비를 높이로 나누어 계산됩니다. 지원되는 값은 0.75에서 1.8(포함) 사이입니다. 여러 값을 쉼표로 구분해야 합니다. 이 매개 변수를 지정하지 않으면 서비스는 가로 세로 비율로 0.5에서 2.0(포함) 사이의 가로 세로 비율로 하나의 자르기 제안을 반환합니다. |
요청 본문
Name | 필수 | 형식 | Description |
---|---|---|---|
url | True |
string |
이미지의 공개적으로 연결할 수 있는 URL입니다. |
응답
Name | 형식 | Description |
---|---|---|
200 OK |
성공 |
|
Other Status Codes |
오류 헤더 x-ms-error-code: string |
예제
AnalyzeImage_CustomModel
샘플 요청
POST /imageanalysis:analyze?model-name=my_model_name&api-version=2023-04-01-preview
{
"url": "https://example.com/image.jpg"
}
샘플 응답
{
"customModelResult": {
"objectsResult": {
"values": [
{
"id": "1",
"boundingBox": {
"x": 197,
"y": 68,
"w": 356,
"h": 394
},
"tags": [
{
"name": "class1",
"confidence": 0.92431640625
}
]
},
{
"id": "2",
"boundingBox": {
"x": 0,
"y": 77,
"w": 241,
"h": 359
},
"tags": [
{
"name": "class1",
"confidence": 0.87890625
}
]
}
]
}
},
"modelVersion": "2023-04-01-preview",
"metadata": {
"width": 660,
"height": 495
}
}
정의
Name | Description |
---|---|
Adult |
성인 콘텐츠 일치를 설명하는 개체입니다. |
Adult |
이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다. |
Bounding |
이미지 내 영역의 경계 상자입니다. |
Caption |
이미지가 묘사하는 내용에 대한 간략한 설명입니다. |
Crop |
스마트 자르기를 위해 식별되는 지역입니다. 요청된 각 가로 세로 비율에 대해 하나의 지역이 반환됩니다. |
Dense |
이미지가 묘사하는 내용에 대한 간략한 설명입니다. |
Dense |
캡션 목록입니다. |
Detected |
이미지에서 감지된 개체를 설명합니다. |
Detected |
이미지에서 감지된 사람입니다. |
Document |
단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다. |
Document |
입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다. |
Document |
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다. |
Document |
관찰된 텍스트 스타일을 나타내는 개체입니다. |
Document |
연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다. |
Error |
오류가 발생할 때 응답이 반환됩니다. |
Error |
오류 정보입니다. |
Error |
자세한 오류입니다. |
Image |
다양한 유형의 이미지 분석의 결합된 결과를 설명합니다. |
Image |
높이 및 너비와 같은 이미지 메타데이터 정보입니다. |
Image |
이미지의 예측 결과를 설명합니다. |
Image |
분석할 이미지를 가리키는 URL이 있는 JSON 문서입니다. |
Objects |
이미지에서 검색된 개체를 설명합니다. |
People |
이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다. |
Read |
읽기 작업의 결과입니다. |
Smart |
스마트 자르기 결과입니다. |
Tag |
신뢰도 점수와 함께 이미지의 엔터티 관찰입니다. |
Tags |
신뢰 수준이 있는 태그 목록입니다. |
Visual |
요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다. |
AdultMatch
성인 콘텐츠 일치를 설명하는 개체입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number (double) minimum: 0maximum: 1 |
일치하는 성인 콘텐츠의 신뢰도 수준을 나타내는 값입니다. |
isMatch |
boolean |
이미지가 성인 콘텐츠와 일치하는지 여부를 나타내는 값입니다. |
AdultResult
이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다.
Name | 형식 | Description |
---|---|---|
adult |
성인 콘텐츠 일치를 설명하는 개체입니다. |
|
gore |
성인 콘텐츠 일치를 설명하는 개체입니다. |
|
racy |
성인 콘텐츠 일치를 설명하는 개체입니다. |
BoundingBox
이미지 내 영역의 경계 상자입니다.
Name | 형식 | Description |
---|---|---|
h |
integer (int32) minimum: 1 |
영역의 왼쪽 위 지점에서 측정된 높이(픽셀)입니다. |
w |
integer (int32) minimum: 1 |
영역의 왼쪽 위 지점에서 측정된 너비(픽셀)입니다. |
x |
integer (int32) minimum: 0 |
영역 왼쪽 상단 지점의 왼쪽 좌표(픽셀)입니다. |
y |
integer (int32) minimum: 0 |
영역 왼쪽 상단 지점의 위쪽 좌표(픽셀)입니다. |
CaptionResult
이미지가 묘사하는 내용에 대한 간략한 설명입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number (double) minimum: 0maximum: 1 |
서비스가 캡션에 있는 신뢰도 수준입니다. |
text |
string minLength: 1 |
캡션의 텍스트입니다. |
CropRegion
스마트 자르기를 위해 식별되는 지역입니다. 요청된 각 가로 세로 비율에 대해 하나의 지역이 반환됩니다.
Name | 형식 | Description |
---|---|---|
aspectRatio |
number (double) |
자르기 영역의 가로 세로 비율입니다. |
boundingBox |
이미지 내 영역의 경계 상자입니다. |
DenseCaption
이미지가 묘사하는 내용에 대한 간략한 설명입니다.
Name | 형식 | Description |
---|---|---|
boundingBox |
이미지 내 영역의 경계 상자입니다. |
|
confidence |
number (double) minimum: 0maximum: 1 |
서비스가 캡션에 있는 신뢰도 수준입니다. |
text |
string minLength: 1 |
캡션의 텍스트입니다. |
DenseCaptionsResult
캡션 목록입니다.
Name | 형식 | Description |
---|---|---|
values |
캡션 목록입니다. |
DetectedObject
이미지에서 감지된 개체를 설명합니다.
Name | 형식 | Description |
---|---|---|
boundingBox |
이미지 내 영역의 경계 상자입니다. |
|
id |
string minLength: 1 |
검색된 개체의 ID입니다. |
tags |
Tag[] |
감지된 개체의 분류 신뢰도입니다. |
DetectedPerson
이미지에서 감지된 사람입니다.
Name | 형식 | Description |
---|---|---|
boundingBox |
이미지 내 영역의 경계 상자입니다. |
|
confidence |
number (double) minimum: 0maximum: 1 |
0에서 1 사이의 값으로 이미지에서 사람을 관찰한 신뢰도 점수입니다. |
DocumentLine
단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.
Name | 형식 | Description |
---|---|---|
boundingBox |
number[] (double) |
줄의 경계 상자입니다. |
content |
string minLength: 1 |
포함된 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다. |
spans |
읽기 순서로 연결된 콘텐츠의 줄 위치입니다. |
DocumentPage
입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.
Name | 형식 | Description |
---|---|---|
angle |
number (double) |
(-180, 180] 사이의 각도로 측정된 시계 방향으로 콘텐츠의 일반 방향입니다. |
height |
number (double) |
이미지/PDF의 높이(각각 픽셀/인치)입니다. |
lines |
페이지에서 추출된 줄로, 텍스트 요소와 시각적 요소가 모두 포함될 수 있습니다. |
|
pageNumber |
integer (int32) |
입력 문서의 1부터 시작하는 페이지 번호입니다. |
spans |
읽기 순서로 연결된 콘텐츠의 페이지 위치입니다. |
|
width |
number (double) |
이미지/PDF의 너비(각각 픽셀/인치)입니다. |
words |
페이지에서 추출된 단어입니다. |
DocumentSpan
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.
Name | 형식 | Description |
---|---|---|
length |
integer (int32) |
범위가 나타내는 콘텐츠의 문자 수입니다. |
offset |
integer (int32) |
범위가 나타내는 콘텐츠의 인덱스(0부터 시작하는 인덱스)입니다. |
DocumentStyle
관찰된 텍스트 스타일을 나타내는 개체입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number (double) |
스타일을 올바르게 식별할 수 있습니다. |
isHandwritten |
boolean |
콘텐츠 필기 여부입니다. |
spans |
스타일이 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다. |
DocumentWord
연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.
Name | 형식 | Description |
---|---|---|
boundingBox |
number[] (double) |
단어의 경계 상자입니다. |
confidence |
number (double) |
단어를 올바르게 추출할 때의 신뢰도입니다. |
content |
string minLength: 1 |
단어의 텍스트 내용입니다. |
span |
오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다. |
ErrorResponse
오류가 발생할 때 응답이 반환됩니다.
Name | 형식 | Description |
---|---|---|
error |
오류 정보입니다. |
ErrorResponseDetails
오류 정보입니다.
Name | 형식 | Description |
---|---|---|
code |
string |
오류 코드입니다. |
details |
자세한 오류 목록입니다. |
|
innererror |
자세한 오류입니다. |
|
message |
string |
오류 메시지입니다. |
target |
string |
오류의 대상입니다. |
ErrorResponseInnerError
자세한 오류입니다.
Name | 형식 | Description |
---|---|---|
code |
string |
오류 코드입니다. |
innererror |
자세한 오류입니다. |
|
message |
string |
오류 메시지입니다. |
ImageAnalysisResult
다양한 유형의 이미지 분석의 결합된 결과를 설명합니다.
Name | 형식 | Description |
---|---|---|
adultResult |
이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다. |
|
captionResult |
이미지가 묘사하는 내용에 대한 간략한 설명입니다. |
|
customModelResult |
이미지의 예측 결과를 설명합니다. |
|
denseCaptionsResult |
캡션 목록입니다. |
|
metadata |
높이 및 너비와 같은 이미지 메타데이터 정보입니다. |
|
modelVersion |
string minLength: 1 |
모델 버전입니다. |
objectsResult |
이미지에서 검색된 개체를 설명합니다. |
|
peopleResult |
이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다. |
|
readResult |
읽기 작업의 결과입니다. |
|
smartCropsResult |
스마트 자르기 결과입니다. |
|
tagsResult |
신뢰 수준이 있는 태그 목록입니다. |
ImageMetadataApiModel
높이 및 너비와 같은 이미지 메타데이터 정보입니다.
Name | 형식 | Description |
---|---|---|
height |
integer (int32) minimum: 1 |
이미지의 높이(픽셀)입니다. |
width |
integer (int32) minimum: 1 |
이미지의 너비(픽셀)입니다. |
ImagePredictionResult
이미지의 예측 결과를 설명합니다.
Name | 형식 | Description |
---|---|---|
objectsResult |
이미지에서 검색된 개체를 설명합니다. |
|
tagsResult |
신뢰 수준이 있는 태그 목록입니다. |
ImageUrl
분석할 이미지를 가리키는 URL이 있는 JSON 문서입니다.
Name | 형식 | Description |
---|---|---|
url |
string |
이미지의 공개적으로 연결할 수 있는 URL입니다. |
ObjectsResult
이미지에서 검색된 개체를 설명합니다.
Name | 형식 | Description |
---|---|---|
values |
검색된 개체의 배열입니다. |
PeopleResult
이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다.
Name | 형식 | Description |
---|---|---|
values |
검색된 사용자 배열입니다. |
ReadResult
읽기 작업의 결과입니다.
Name | 형식 | Description |
---|---|---|
content |
string minLength: 1 |
모든 텍스트 및 시각적 요소의 문자열 표현을 읽기 순서로 연결합니다. |
pages |
분석된 페이지 목록입니다. |
|
stringIndexType |
string minLength: 1 |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드로는 'textElements', 'unicodeCodePoint', 'utf16CodeUnit' 등이 있습니다. |
styles |
추출된 글꼴 스타일입니다. |
SmartCropsResult
스마트 자르기 결과입니다.
Name | 형식 | Description |
---|---|---|
values |
이미지를 자르는 데 권장되는 지역입니다. |
Tag
신뢰도 점수와 함께 이미지의 엔터티 관찰입니다.
Name | 형식 | Description |
---|---|---|
confidence |
number (double) minimum: 0maximum: 1 |
엔터티가 관찰된 신뢰도 수준입니다. |
name |
string minLength: 1 |
엔터티의 이름입니다. |
TagsResult
신뢰 수준이 있는 태그 목록입니다.
Name | 형식 | Description |
---|---|---|
values |
Tag[] |
신뢰 수준이 있는 태그 목록입니다. |
VisualFeature
요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.
값 | Description |
---|---|
caption | |
denseCaptions | |
objects | |
people | |
read | |
smartCrops | |
tags |