다음을 통해 공유


Image Analysis - Analyze Image

입력 이미지를 분석합니다. 요청에는 콘텐츠 형식 ['image/*', 'application/octet-stream']이 있는 이미지 스트림 또는 이미지 스트림을 검색하는 데 사용할 URL 속성이 포함된 JSON 페이로드가 포함됩니다.

POST /imageanalysis:analyze?api-version=2023-04-01-preview
POST /imageanalysis:analyze?features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
api-version
query True

string

요청된 API 버전입니다.

features
query

VisualFeature[]

요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.

gender-neutral-caption
query

boolean

캡션 및 denseCaptions 기능에 대해 성 중립적 캡션을 사용하도록 설정하는 부울 플래그입니다. 이 매개 변수를 지정하지 않으면 기본값은 "false"입니다.

language
query

string

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어 목록은 https://aka.ms/cv-languages 참조하세요.

model-name
query

string

사용자 지정 학습된 모델의 이름입니다. 매개 변수 "features"를 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.

smartcrops-aspect-ratios
query

string

smartCrops 기능에 사용할 가로 세로 비율 목록입니다. 가로 세로 비율은 대상 자르기 너비를 높이로 나누어 계산됩니다. 지원되는 값은 0.75에서 1.8(포함) 사이입니다. 여러 값을 쉼표로 구분해야 합니다. 이 매개 변수를 지정하지 않으면 서비스는 가로 세로 비율로 0.5에서 2.0(포함) 사이의 가로 세로 비율로 하나의 자르기 제안을 반환합니다.

요청 본문

Name 필수 형식 Description
url True

string

이미지의 공개적으로 연결할 수 있는 URL입니다.

응답

Name 형식 Description
200 OK

ImageAnalysisResult

성공

Other Status Codes

ErrorResponse

오류

헤더

x-ms-error-code: string

예제

AnalyzeImage_CustomModel

샘플 요청

POST /imageanalysis:analyze?model-name=my_model_name&api-version=2023-04-01-preview

{
  "url": "https://example.com/image.jpg"
}

샘플 응답

{
  "customModelResult": {
    "objectsResult": {
      "values": [
        {
          "id": "1",
          "boundingBox": {
            "x": 197,
            "y": 68,
            "w": 356,
            "h": 394
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.92431640625
            }
          ]
        },
        {
          "id": "2",
          "boundingBox": {
            "x": 0,
            "y": 77,
            "w": 241,
            "h": 359
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.87890625
            }
          ]
        }
      ]
    }
  },
  "modelVersion": "2023-04-01-preview",
  "metadata": {
    "width": 660,
    "height": 495
  }
}

정의

Name Description
AdultMatch

성인 콘텐츠 일치를 설명하는 개체입니다.

AdultResult

이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다.

BoundingBox

이미지 내 영역의 경계 상자입니다.

CaptionResult

이미지가 묘사하는 내용에 대한 간략한 설명입니다.

CropRegion

스마트 자르기를 위해 식별되는 지역입니다. 요청된 각 가로 세로 비율에 대해 하나의 지역이 반환됩니다.

DenseCaption

이미지가 묘사하는 내용에 대한 간략한 설명입니다.

DenseCaptionsResult

캡션 목록입니다.

DetectedObject

이미지에서 감지된 개체를 설명합니다.

DetectedPerson

이미지에서 감지된 사람입니다.

DocumentLine

단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.

DocumentPage

입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.

DocumentSpan

오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.

DocumentStyle

관찰된 텍스트 스타일을 나타내는 개체입니다.

DocumentWord

연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.

ErrorResponse

오류가 발생할 때 응답이 반환됩니다.

ErrorResponseDetails

오류 정보입니다.

ErrorResponseInnerError

자세한 오류입니다.

ImageAnalysisResult

다양한 유형의 이미지 분석의 결합된 결과를 설명합니다.

ImageMetadataApiModel

높이 및 너비와 같은 이미지 메타데이터 정보입니다.

ImagePredictionResult

이미지의 예측 결과를 설명합니다.

ImageUrl

분석할 이미지를 가리키는 URL이 있는 JSON 문서입니다.

ObjectsResult

이미지에서 검색된 개체를 설명합니다.

PeopleResult

이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다.

ReadResult

읽기 작업의 결과입니다.

SmartCropsResult

스마트 자르기 결과입니다.

Tag

신뢰도 점수와 함께 이미지의 엔터티 관찰입니다.

TagsResult

신뢰 수준이 있는 태그 목록입니다.

VisualFeature

요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.

AdultMatch

성인 콘텐츠 일치를 설명하는 개체입니다.

Name 형식 Description
confidence

number (double)

minimum: 0
maximum: 1

일치하는 성인 콘텐츠의 신뢰도 수준을 나타내는 값입니다.

isMatch

boolean

이미지가 성인 콘텐츠와 일치하는지 여부를 나타내는 값입니다.

AdultResult

이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다.

Name 형식 Description
adult

AdultMatch

성인 콘텐츠 일치를 설명하는 개체입니다.

gore

AdultMatch

성인 콘텐츠 일치를 설명하는 개체입니다.

racy

AdultMatch

성인 콘텐츠 일치를 설명하는 개체입니다.

BoundingBox

이미지 내 영역의 경계 상자입니다.

Name 형식 Description
h

integer (int32)

minimum: 1

영역의 왼쪽 위 지점에서 측정된 높이(픽셀)입니다.

w

integer (int32)

minimum: 1

영역의 왼쪽 위 지점에서 측정된 너비(픽셀)입니다.

x

integer (int32)

minimum: 0

영역 왼쪽 상단 지점의 왼쪽 좌표(픽셀)입니다.

y

integer (int32)

minimum: 0

영역 왼쪽 상단 지점의 위쪽 좌표(픽셀)입니다.

CaptionResult

이미지가 묘사하는 내용에 대한 간략한 설명입니다.

Name 형식 Description
confidence

number (double)

minimum: 0
maximum: 1

서비스가 캡션에 있는 신뢰도 수준입니다.

text

string

minLength: 1

캡션의 텍스트입니다.

CropRegion

스마트 자르기를 위해 식별되는 지역입니다. 요청된 각 가로 세로 비율에 대해 하나의 지역이 반환됩니다.

Name 형식 Description
aspectRatio

number (double)

자르기 영역의 가로 세로 비율입니다.

boundingBox

BoundingBox

이미지 내 영역의 경계 상자입니다.

DenseCaption

이미지가 묘사하는 내용에 대한 간략한 설명입니다.

Name 형식 Description
boundingBox

BoundingBox

이미지 내 영역의 경계 상자입니다.

confidence

number (double)

minimum: 0
maximum: 1

서비스가 캡션에 있는 신뢰도 수준입니다.

text

string

minLength: 1

캡션의 텍스트입니다.

DenseCaptionsResult

캡션 목록입니다.

Name 형식 Description
values

DenseCaption[]

캡션 목록입니다.

DetectedObject

이미지에서 감지된 개체를 설명합니다.

Name 형식 Description
boundingBox

BoundingBox

이미지 내 영역의 경계 상자입니다.

id

string

minLength: 1

검색된 개체의 ID입니다.

tags

Tag[]

감지된 개체의 분류 신뢰도입니다.

DetectedPerson

이미지에서 감지된 사람입니다.

Name 형식 Description
boundingBox

BoundingBox

이미지 내 영역의 경계 상자입니다.

confidence

number (double)

minimum: 0
maximum: 1

0에서 1 사이의 값으로 이미지에서 사람을 관찰한 신뢰도 점수입니다.

DocumentLine

단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.

Name 형식 Description
boundingBox

number[] (double)

줄의 경계 상자입니다.

content

string

minLength: 1

포함된 요소의 연결된 콘텐츠를 읽기 순서로 연결합니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 줄 위치입니다.

DocumentPage

입력에서 페이지에서 추출된 콘텐츠 및 레이아웃 요소입니다.

Name 형식 Description
angle

number (double)

(-180, 180] 사이의 각도로 측정된 시계 방향으로 콘텐츠의 일반 방향입니다.

height

number (double)

이미지/PDF의 높이(각각 픽셀/인치)입니다.

lines

DocumentLine[]

페이지에서 추출된 줄로, 텍스트 요소와 시각적 요소가 모두 포함될 수 있습니다.

pageNumber

integer (int32)

입력 문서의 1부터 시작하는 페이지 번호입니다.

spans

DocumentSpan[]

읽기 순서로 연결된 콘텐츠의 페이지 위치입니다.

width

number (double)

이미지/PDF의 너비(각각 픽셀/인치)입니다.

words

DocumentWord[]

페이지에서 추출된 단어입니다.

DocumentSpan

오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.

Name 형식 Description
length

integer (int32)

범위가 나타내는 콘텐츠의 문자 수입니다.

offset

integer (int32)

범위가 나타내는 콘텐츠의 인덱스(0부터 시작하는 인덱스)입니다.

DocumentStyle

관찰된 텍스트 스타일을 나타내는 개체입니다.

Name 형식 Description
confidence

number (double)

스타일을 올바르게 식별할 수 있습니다.

isHandwritten

boolean

콘텐츠 필기 여부입니다.

spans

DocumentSpan[]

스타일이 적용되는 연결된 콘텐츠의 텍스트 요소 위치입니다.

DocumentWord

연속된 문자 시퀀스로 구성된 단어 개체입니다. 중국어, 일본어 및 한국어와 같이 공백으로 구분되지 않은 언어의 경우 각 문자가 자체 단어로 표시됩니다.

Name 형식 Description
boundingBox

number[] (double)

단어의 경계 상자입니다.

confidence

number (double)

단어를 올바르게 추출할 때의 신뢰도입니다.

content

string

minLength: 1

단어의 텍스트 내용입니다.

span

DocumentSpan

오프셋 및 길이로 지정된 연결된 콘텐츠 속성의 연속 영역입니다.

ErrorResponse

오류가 발생할 때 응답이 반환됩니다.

Name 형식 Description
error

ErrorResponseDetails

오류 정보입니다.

ErrorResponseDetails

오류 정보입니다.

Name 형식 Description
code

string

오류 코드입니다.

details

ErrorResponseDetails[]

자세한 오류 목록입니다.

innererror

ErrorResponseInnerError

자세한 오류입니다.

message

string

오류 메시지입니다.

target

string

오류의 대상입니다.

ErrorResponseInnerError

자세한 오류입니다.

Name 형식 Description
code

string

오류 코드입니다.

innererror

ErrorResponseInnerError

자세한 오류입니다.

message

string

오류 메시지입니다.

ImageAnalysisResult

다양한 유형의 이미지 분석의 결합된 결과를 설명합니다.

Name 형식 Description
adultResult

AdultResult

이미지에 성인 지향 콘텐츠가 포함되는지 또는 외설적인지 여부를 설명하는 개체입니다.

captionResult

CaptionResult

이미지가 묘사하는 내용에 대한 간략한 설명입니다.

customModelResult

ImagePredictionResult

이미지의 예측 결과를 설명합니다.

denseCaptionsResult

DenseCaptionsResult

캡션 목록입니다.

metadata

ImageMetadataApiModel

높이 및 너비와 같은 이미지 메타데이터 정보입니다.

modelVersion

string

minLength: 1

모델 버전입니다.

objectsResult

ObjectsResult

이미지에서 검색된 개체를 설명합니다.

peopleResult

PeopleResult

이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다.

readResult

ReadResult

읽기 작업의 결과입니다.

smartCropsResult

SmartCropsResult

스마트 자르기 결과입니다.

tagsResult

TagsResult

신뢰 수준이 있는 태그 목록입니다.

ImageMetadataApiModel

높이 및 너비와 같은 이미지 메타데이터 정보입니다.

Name 형식 Description
height

integer (int32)

minimum: 1

이미지의 높이(픽셀)입니다.

width

integer (int32)

minimum: 1

이미지의 너비(픽셀)입니다.

ImagePredictionResult

이미지의 예측 결과를 설명합니다.

Name 형식 Description
objectsResult

ObjectsResult

이미지에서 검색된 개체를 설명합니다.

tagsResult

TagsResult

신뢰 수준이 있는 태그 목록입니다.

ImageUrl

분석할 이미지를 가리키는 URL이 있는 JSON 문서입니다.

Name 형식 Description
url

string

이미지의 공개적으로 연결할 수 있는 URL입니다.

ObjectsResult

이미지에서 검색된 개체를 설명합니다.

Name 형식 Description
values

DetectedObject[]

검색된 개체의 배열입니다.

PeopleResult

이미지에 사람이 포함되어 있는지 여부를 설명하는 개체입니다.

Name 형식 Description
values

DetectedPerson[]

검색된 사용자 배열입니다.

ReadResult

읽기 작업의 결과입니다.

Name 형식 Description
content

string

minLength: 1

모든 텍스트 및 시각적 요소의 문자열 표현을 읽기 순서로 연결합니다.

pages

DocumentPage[]

분석된 페이지 목록입니다.

stringIndexType

string

minLength: 1

문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드로는 'textElements', 'unicodeCodePoint', 'utf16CodeUnit' 등이 있습니다.

styles

DocumentStyle[]

추출된 글꼴 스타일입니다.

SmartCropsResult

스마트 자르기 결과입니다.

Name 형식 Description
values

CropRegion[]

이미지를 자르는 데 권장되는 지역입니다.

Tag

신뢰도 점수와 함께 이미지의 엔터티 관찰입니다.

Name 형식 Description
confidence

number (double)

minimum: 0
maximum: 1

엔터티가 관찰된 신뢰도 수준입니다.

name

string

minLength: 1

엔터티의 이름입니다.

TagsResult

신뢰 수준이 있는 태그 목록입니다.

Name 형식 Description
values

Tag[]

신뢰 수준이 있는 태그 목록입니다.

VisualFeature

요청된 시각적 기능: 태그, 개체, 캡션, denseCaptions, 읽기, smartCrops, people. 매개 변수 "model-name"을 지정하지 않은 경우 이 매개 변수를 지정해야 합니다.

Description
caption
denseCaptions
objects
people
read
smartCrops
tags