다음을 통해 공유


Document Classifiers - Classify Document From Stream

문서 분류기를 사용하여 문서를 분류합니다.

POST {endpoint}/documentintelligence/documentClassifiers/{classifierId}:analyze?api-version=2024-11-30
POST {endpoint}/documentintelligence/documentClassifiers/{classifierId}:analyze?api-version=2024-11-30&stringIndexType={stringIndexType}&split={split}&pages={pages}

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
classifierId
path True

string

고유한 문서 분류자 이름입니다.

regex 패턴: ^[a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}$

endpoint
path True

string

uri

문서 인텔리전스 서비스 엔드포인트입니다.

api-version
query True

string

이 작업에 사용할 API 버전입니다.

pages
query

string

분석할 1부터 시작하는 페이지 번호입니다. 전. "1-3,5,7-9"

regex 패턴: ^(\d+(-\d+)?)(,\s*(\d+(-\d+)?))*$

split
query

SplitMode

문서 분할 모드입니다.

stringIndexType
query

StringIndexType

문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다.

요청 본문

Media Types: "application/octet-stream", "application/pdf", "image/jpeg", "image/png", "image/tiff", "image/bmp", "image/heif", "text/html", "application/vnd.openxmlformats-officedocument.wordprocessingml.document", "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet", "application/vnd.openxmlformats-officedocument.presentationml.presentation"

Name 형식 Description
input

string

입력 콘텐츠입니다.

응답

Name 형식 Description
202 Accepted

처리를 위해 요청이 수락되었지만 처리가 아직 완료되지 않았습니다.

헤더

  • Operation-Location: string
  • Retry-After: integer
Other Status Codes

DocumentIntelligenceErrorResponse

예기치 않은 오류 응답입니다.

보안

Ocp-Apim-Subscription-Key

형식: apiKey
In(다음 안에): header

OAuth2Auth

형식: oauth2
Flow: accessCode
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/authorize
토큰 URL: https://login.microsoftonline.com/common/oauth2/token

범위

Name Description
https://cognitiveservices.azure.com/.default

예제

Classify Document from Url

샘플 요청

POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/classifierId:analyze?api-version=2024-11-30&stringIndexType=textElements

"{binaryFile}"

샘플 응답

Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/customClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-11-30

정의

Name Description
DocumentIntelligenceError

오류 개체입니다.

DocumentIntelligenceErrorResponse

오류 응답 개체입니다.

DocumentIntelligenceInnerError

오류에 대한 보다 구체적인 정보를 포함하는 개체입니다.

SplitMode

파일 분할 동작입니다.

StringIndexType

문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다.

DocumentIntelligenceError

오류 개체입니다.

Name 형식 Description
code

string

서버에서 정의한 오류 코드 집합 중 하나입니다.

details

DocumentIntelligenceError[]

이 보고된 오류로 이어진 특정 오류에 대한 세부 정보 배열입니다.

innererror

DocumentIntelligenceInnerError

오류에 대한 현재 개체보다 더 구체적인 정보를 포함하는 개체입니다.

message

string

사람이 읽을 수 있는 오류 표현입니다.

target

string

오류의 대상입니다.

DocumentIntelligenceErrorResponse

오류 응답 개체입니다.

Name 형식 Description
error

DocumentIntelligenceError

오류 정보입니다.

DocumentIntelligenceInnerError

오류에 대한 보다 구체적인 정보를 포함하는 개체입니다.

Name 형식 Description
code

string

서버에서 정의한 오류 코드 집합 중 하나입니다.

innererror

DocumentIntelligenceInnerError

내부 오류입니다.

message

string

사람이 읽을 수 있는 오류 표현입니다.

SplitMode

파일 분할 동작입니다.

Name 형식 Description
auto

string

파일을 문서로 자동으로 분할합니다.

none

string

전체 파일을 단일 문서로 처리합니다.

perPage

string

파일의 각 페이지를 별도의 문서로 처리합니다.

StringIndexType

문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다.

Name 형식 Description
textElements

string

유니코드 8.0.0에 정의된 사용자 인식 표시 문자 또는 그래프 클러스터입니다.

unicodeCodePoint

string

단일 유니코드 코드 포인트로 표현되는 문자 단위입니다. Python 3에서 사용됩니다.

utf16CodeUnit

string

16비트 유니코드 코드 단위로 표현되는 문자 단위입니다. JavaScript, Java 및 .NET에서 사용됩니다.