Image Analysis - Analyze Image

참조

서비스:: Azure AI Services

API 버전:: 2023-04-01-preview

입력 이미지를 분석합니다. 요청에는 콘텐츠 형식 ['image/*', 'application/octet-stream']이 있는 이미지 스트림 또는 이미지 스트림을 검색하는 데 사용할 URL 속성이 포함된 JSON 페이로드가 포함됩니다.

POST /imageanalysis:analyze?api-version=2023-04-01-preview

선택적 매개 변수:

POST /imageanalysis:analyze?features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview

URI 매개 변수

Name	In(다음 안에)	필수	형식	Description
api-version	query	True	string	요청된 API 버전입니다.
features	query		VisualFeature[]	요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.
gender-neutral-caption	query		boolean	캡션 및 denseCaptions 기능에 대해 성 중립적 캡션을 사용하도록 설정하는 부울 플래그입니다. 이 매개 변수를 지정하지 않으면 기본값은 "false"입니다.
language	query		string	출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어 목록은 https://aka.ms/cv-languages 참조하세요.
model-name	query		string	사용자 지정 학습된 모델의 이름입니다. 매개 변수 "features"를 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.
smartcrops-aspect-ratios	query		string	smartCrops 기능에 사용할 가로 세로 비율 목록입니다. 가로 세로 비율은 대상 자르기 너비를 높이로 나누어 계산됩니다. 지원되는 값은 0.75에서 1.8(포함) 사이입니다. 여러 값을 쉼표로 구분해야 합니다. 이 매개 변수를 지정하지 않으면 서비스는 가로 세로 비율로 0.5에서 2.0(포함) 사이의 가로 세로 비율로 하나의 자르기 제안을 반환합니다.

요청 본문

Name	필수	형식	Description
url	True	string	이미지의 공개적으로 연결할 수 있는 URL입니다.

응답

Name	형식	Description
200 OK	ImageAnalysisResult	성공
Other Status Codes	ErrorResponse	오류 헤더 x-ms-error-code: string

Name

형식

Description

200 OK

ImageAnalysisResult

성공

Other Status Codes

ErrorResponse

오류

헤더

x-ms-error-code: string

예제

AnalyzeImage_CustomModel

샘플 요청

HTTP

POST /imageanalysis:analyze?model-name=my_model_name&api-version=2023-04-01-preview

{
  "url": "https://example.com/image.jpg"
}

샘플 응답

상태 코드:: 200

{
  "customModelResult": {
    "objectsResult": {
      "values": [
        {
          "id": "1",
          "boundingBox": {
            "x": 197,
            "y": 68,
            "w": 356,
            "h": 394
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.92431640625
            }
          ]
        },
        {
          "id": "2",
          "boundingBox": {
            "x": 0,
            "y": 77,
            "w": 241,
            "h": 359
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.87890625
            }
          ]
        }
      ]
    }
  },
  "modelVersion": "2023-04-01-preview",
  "metadata": {
    "width": 660,
    "height": 495
  }
}

정의

Name	Description
AdultMatch	성인 콘텐츠 일치를 설명하는 개체입니다.
AdultResult	이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다.
BoundingBox	이미지 내 영역의 경계 상자입니다.
CaptionResult	이미지가 묘사하는 내용에 대한 간략한 설명입니다.
CropRegion	스마트 자르기를 위해 식별되는 지역입니다. 요청된 각 가로 세로 비율에 대해 하나의 지역이 반환됩니다.
DenseCaption	이미지가 묘사하는 내용에 대한 간략한 설명입니다.
DenseCaptionsResult	캡션 목록입니다.
DetectedObject	이미지에서 감지된 개체를 설명합니다.
DetectedPerson	이미지에서 감지된 사람입니다.
DocumentLine	단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.
DocumentPage	입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.
DocumentSpan	오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.
DocumentStyle	관찰된 텍스트 스타일을 나타내는 개체입니다.
DocumentWord	연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.
ErrorResponse	오류가 발생할 때 응답이 반환됩니다.
ErrorResponseDetails	오류 정보입니다.
ErrorResponseInnerError	자세한 오류입니다.
ImageAnalysisResult	다양한 유형의 이미지 분석의 결합된 결과를 설명합니다.
ImageMetadataApiModel	높이 및 너비와 같은 이미지 메타데이터 정보입니다.
ImagePredictionResult	이미지의 예측 결과를 설명합니다.
ImageUrl	분석할 이미지를 가리키는 URL이 있는 JSON 문서입니다.
ObjectsResult	이미지에서 검색된 개체를 설명합니다.
PeopleResult	이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다.
ReadResult	읽기 작업의 결과입니다.
SmartCropsResult	스마트 자르기 결과입니다.
Tag	신뢰도 점수와 함께 이미지의 엔터티 관찰입니다.
TagsResult	신뢰 수준이 있는 태그 목록입니다.
VisualFeature	요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.

AdultMatch

Object

성인 콘텐츠 일치를 설명하는 개체입니다.

Name	형식	Description
confidence	number (double) minimum: 0 maximum: 1	일치하는 성인 콘텐츠의 신뢰도 수준을 나타내는 값입니다.
isMatch	boolean	이미지가 성인 콘텐츠와 일치하는지 여부를 나타내는 값입니다.

AdultResult

Object

이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다.

Name	형식	Description
adult	AdultMatch	성인 콘텐츠 일치를 설명하는 개체입니다.
gore	AdultMatch	성인 콘텐츠 일치를 설명하는 개체입니다.
racy	AdultMatch	성인 콘텐츠 일치를 설명하는 개체입니다.

BoundingBox

Object

이미지 내 영역의 경계 상자입니다.

Name	형식	Description
h	integer (int32) minimum: 1	영역의 왼쪽 위 지점에서 측정된 높이(픽셀)입니다.
w	integer (int32) minimum: 1	영역의 왼쪽 위 지점에서 측정된 너비(픽셀)입니다.
x	integer (int32) minimum: 0	영역 왼쪽 상단 지점의 왼쪽 좌표(픽셀)입니다.
y	integer (int32) minimum: 0	영역 왼쪽 상단 지점의 위쪽 좌표(픽셀)입니다.

CaptionResult

Object

이미지가 묘사하는 내용에 대한 간략한 설명입니다.

Name	형식	Description
confidence	number (double) minimum: 0 maximum: 1	서비스가 캡션에 있는 신뢰도 수준입니다.
text	string minLength: 1	캡션의 텍스트입니다.

CropRegion

Object

스마트 자르기를 위해 식별되는 지역입니다. 요청된 각 가로 세로 비율에 대해 하나의 지역이 반환됩니다.

Name	형식	Description
aspectRatio	number (double)	자르기 영역의 가로 세로 비율입니다.
boundingBox	BoundingBox	이미지 내 영역의 경계 상자입니다.

DenseCaption

Object

이미지가 묘사하는 내용에 대한 간략한 설명입니다.

Name	형식	Description
boundingBox	BoundingBox	이미지 내 영역의 경계 상자입니다.
confidence	number (double) minimum: 0 maximum: 1	서비스가 캡션에 있는 신뢰도 수준입니다.
text	string minLength: 1	캡션의 텍스트입니다.

DenseCaptionsResult

Object

캡션 목록입니다.

Name	형식	Description
values	DenseCaption[]	캡션 목록입니다.

DetectedObject

Object

이미지에서 감지된 개체를 설명합니다.

Name	형식	Description
boundingBox	BoundingBox	이미지 내 영역의 경계 상자입니다.
id	string minLength: 1	검색된 개체의 ID입니다.
tags	Tag[]	감지된 개체의 분류 신뢰도입니다.

DetectedPerson

Object

이미지에서 감지된 사람입니다.

Name	형식	Description
boundingBox	BoundingBox	이미지 내 영역의 경계 상자입니다.
confidence	number (double) minimum: 0 maximum: 1	0에서 1 사이의 값으로 이미지에서 사람을 관찰한 신뢰도 점수입니다.

DocumentLine

Object

단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.

Name	형식	Description
boundingBox	number[] (double)	줄의 경계 상자입니다.
content	string minLength: 1	포함된 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다.
spans	DocumentSpan[]	읽기 순서로 연결된 콘텐츠의 줄 위치입니다.

DocumentPage

Object

입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.

Name	형식	Description
angle	number (double)	(-180, 180] 사이의 각도로 측정된 시계 방향으로 콘텐츠의 일반 방향입니다.
height	number (double)	이미지/PDF의 높이(각각 픽셀/인치)입니다.
lines	DocumentLine[]	페이지에서 추출된 줄로, 텍스트 요소와 시각적 요소가 모두 포함될 수 있습니다.
pageNumber	integer (int32)	입력 문서의 1부터 시작하는 페이지 번호입니다.
spans	DocumentSpan[]	읽기 순서로 연결된 콘텐츠의 페이지 위치입니다.
width	number (double)	이미지/PDF의 너비(각각 픽셀/인치)입니다.
words	DocumentWord[]	페이지에서 추출된 단어입니다.

DocumentSpan

Object

오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.

Name	형식	Description
length	integer (int32)	범위가 나타내는 콘텐츠의 문자 수입니다.
offset	integer (int32)	범위가 나타내는 콘텐츠의 인덱스(0부터 시작하는 인덱스)입니다.

DocumentStyle

Object

관찰된 텍스트 스타일을 나타내는 개체입니다.

Name	형식	Description
confidence	number (double)	스타일을 올바르게 식별할 수 있습니다.
isHandwritten	boolean	콘텐츠 필기 여부입니다.
spans	DocumentSpan[]	스타일이 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다.

DocumentWord

Object

연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.

Name	형식	Description
boundingBox	number[] (double)	단어의 경계 상자입니다.
confidence	number (double)	단어를 올바르게 추출할 때의 신뢰도입니다.
content	string minLength: 1	단어의 텍스트 내용입니다.
span	DocumentSpan	오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.

ErrorResponse

Object

오류가 발생할 때 응답이 반환됩니다.

Name	형식	Description
error	ErrorResponseDetails	오류 정보입니다.

ErrorResponseDetails

Object

오류 정보입니다.

Name	형식	Description
code	string	오류 코드입니다.
details	ErrorResponseDetails[]	자세한 오류 목록입니다.
innererror	ErrorResponseInnerError	자세한 오류입니다.
message	string	오류 메시지입니다.
target	string	오류의 대상입니다.

ErrorResponseInnerError

Object

자세한 오류입니다.

Name	형식	Description
code	string	오류 코드입니다.
innererror	ErrorResponseInnerError	자세한 오류입니다.
message	string	오류 메시지입니다.

ImageAnalysisResult

Object

다양한 유형의 이미지 분석의 결합된 결과를 설명합니다.

Name	형식	Description
adultResult	AdultResult	이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다.
captionResult	CaptionResult	이미지가 묘사하는 내용에 대한 간략한 설명입니다.
customModelResult	ImagePredictionResult	이미지의 예측 결과를 설명합니다.
denseCaptionsResult	DenseCaptionsResult	캡션 목록입니다.
metadata	ImageMetadataApiModel	높이 및 너비와 같은 이미지 메타데이터 정보입니다.
modelVersion	string minLength: 1	모델 버전입니다.
objectsResult	ObjectsResult	이미지에서 검색된 개체를 설명합니다.
peopleResult	PeopleResult	이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다.
readResult	ReadResult	읽기 작업의 결과입니다.
smartCropsResult	SmartCropsResult	스마트 자르기 결과입니다.
tagsResult	TagsResult	신뢰 수준이 있는 태그 목록입니다.

ImageMetadataApiModel

Object

높이 및 너비와 같은 이미지 메타데이터 정보입니다.

Name	형식	Description
height	integer (int32) minimum: 1	이미지의 높이(픽셀)입니다.
width	integer (int32) minimum: 1	이미지의 너비(픽셀)입니다.

ImagePredictionResult

Object

이미지의 예측 결과를 설명합니다.

Name	형식	Description
objectsResult	ObjectsResult	이미지에서 검색된 개체를 설명합니다.
tagsResult	TagsResult	신뢰 수준이 있는 태그 목록입니다.

ImageUrl

Object

분석할 이미지를 가리키는 URL이 있는 JSON 문서입니다.

Name	형식	Description
url	string	이미지의 공개적으로 연결할 수 있는 URL입니다.

ObjectsResult

Object

이미지에서 검색된 개체를 설명합니다.

Name	형식	Description
values	DetectedObject[]	검색된 개체의 배열입니다.

PeopleResult

Object

이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다.

Name	형식	Description
values	DetectedPerson[]	검색된 사용자 배열입니다.

ReadResult

Object

읽기 작업의 결과입니다.

Name	형식	Description
content	string minLength: 1	모든 텍스트 및 시각적 요소의 문자열 표현을 읽기 순서로 연결합니다.
pages	DocumentPage[]	분석된 페이지 목록입니다.
stringIndexType	string minLength: 1	문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드로는 'textElements', 'unicodeCodePoint', 'utf16CodeUnit' 등이 있습니다.
styles	DocumentStyle[]	추출된 글꼴 스타일입니다.

SmartCropsResult

Object

스마트 자르기 결과입니다.

Name	형식	Description
values	CropRegion[]	이미지를 자르는 데 권장되는 지역입니다.

Tag

Object

신뢰도 점수와 함께 이미지의 엔터티 관찰입니다.

Name	형식	Description
confidence	number (double) minimum: 0 maximum: 1	엔터티가 관찰된 신뢰도 수준입니다.
name	string minLength: 1	엔터티의 이름입니다.

TagsResult

Object

신뢰 수준이 있는 태그 목록입니다.

Name	형식	Description
values	Tag[]	신뢰 수준이 있는 태그 목록입니다.

VisualFeature

열거형

요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.

값	Description
caption
denseCaptions
objects
people
read
smartCrops
tags

다음을 통해 공유

Image Analysis - Analyze Image

URI 매개 변수

요청 본문

응답

예제

AnalyzeImage_CustomModel

샘플 요청

샘플 응답

정의

AdultMatch

AdultResult

BoundingBox

CaptionResult

CropRegion

DenseCaption

DenseCaptionsResult

DetectedObject

DetectedPerson

DocumentLine

DocumentPage

DocumentSpan

DocumentStyle

DocumentWord

ErrorResponse

ErrorResponseDetails

ErrorResponseInnerError

ImageAnalysisResult

ImageMetadataApiModel

ImagePredictionResult

ImageUrl

ObjectsResult

PeopleResult

ReadResult

SmartCropsResult

Tag

TagsResult

VisualFeature

추가 리소스