Document Classifiers - Classify Document From Stream
문서 분류기를 사용하여 문서를 분류합니다.
POST {endpoint}/documentintelligence/documentClassifiers/{classifierId}:analyze?api-version=2024-11-30
POST {endpoint}/documentintelligence/documentClassifiers/{classifierId}:analyze?api-version=2024-11-30&stringIndexType={stringIndexType}&split={split}&pages={pages}
URI 매개 변수
Name | In(다음 안에) | 필수 | 형식 | Description |
---|---|---|---|---|
classifier
|
path | True |
string |
고유한 문서 분류자 이름입니다. regex 패턴: |
endpoint
|
path | True |
string uri |
문서 인텔리전스 서비스 엔드포인트입니다. |
api-version
|
query | True |
string |
이 작업에 사용할 API 버전입니다. |
pages
|
query |
string |
분석할 1부터 시작하는 페이지 번호입니다. 전. "1-3,5,7-9" regex 패턴: |
|
split
|
query |
문서 분할 모드입니다. |
||
string
|
query |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. |
요청 본문
Media Types: "application/octet-stream", "application/pdf", "image/jpeg", "image/png", "image/tiff", "image/bmp", "image/heif", "text/html", "application/vnd.openxmlformats-officedocument.wordprocessingml.document", "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet", "application/vnd.openxmlformats-officedocument.presentationml.presentation"
Name | 형식 | Description |
---|---|---|
input |
string |
입력 콘텐츠입니다. |
응답
Name | 형식 | Description |
---|---|---|
202 Accepted |
처리를 위해 요청이 수락되었지만 처리가 아직 완료되지 않았습니다. 헤더
|
|
Other Status Codes |
예기치 않은 오류 응답입니다. |
보안
Ocp-Apim-Subscription-Key
형식:
apiKey
In(다음 안에):
header
OAuth2Auth
형식:
oauth2
Flow:
accessCode
권한 부여 URL:
https://login.microsoftonline.com/common/oauth2/authorize
토큰 URL:
https://login.microsoftonline.com/common/oauth2/token
범위
Name | Description |
---|---|
https://cognitiveservices.azure.com/.default |
예제
Classify Document from Url
샘플 요청
POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/classifierId:analyze?api-version=2024-11-30&stringIndexType=textElements
"{binaryFile}"
샘플 응답
Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/customClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-11-30
정의
Name | Description |
---|---|
Document |
오류 개체입니다. |
Document |
오류 응답 개체입니다. |
Document |
오류에 대한 보다 구체적인 정보를 포함하는 개체입니다. |
Split |
파일 분할 동작입니다. |
String |
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다. |
DocumentIntelligenceError
오류 개체입니다.
Name | 형식 | Description |
---|---|---|
code |
string |
서버에서 정의한 오류 코드 집합 중 하나입니다. |
details |
이 보고된 오류로 이어진 특정 오류에 대한 세부 정보 배열입니다. |
|
innererror |
오류에 대한 현재 개체보다 더 구체적인 정보를 포함하는 개체입니다. |
|
message |
string |
사람이 읽을 수 있는 오류 표현입니다. |
target |
string |
오류의 대상입니다. |
DocumentIntelligenceErrorResponse
오류 응답 개체입니다.
Name | 형식 | Description |
---|---|---|
error |
오류 정보입니다. |
DocumentIntelligenceInnerError
오류에 대한 보다 구체적인 정보를 포함하는 개체입니다.
Name | 형식 | Description |
---|---|---|
code |
string |
서버에서 정의한 오류 코드 집합 중 하나입니다. |
innererror |
내부 오류입니다. |
|
message |
string |
사람이 읽을 수 있는 오류 표현입니다. |
SplitMode
파일 분할 동작입니다.
Name | 형식 | Description |
---|---|---|
auto |
string |
파일을 문서로 자동으로 분할합니다. |
none |
string |
전체 파일을 단일 문서로 처리합니다. |
perPage |
string |
파일의 각 페이지를 별도의 문서로 처리합니다. |
StringIndexType
문자열 오프셋 및 길이를 계산하는 데 사용되는 메서드입니다.
Name | 형식 | Description |
---|---|---|
textElements |
string |
유니코드 8.0.0에 정의된 사용자 인식 표시 문자 또는 그래프 클러스터입니다. |
unicodeCodePoint |
string |
단일 유니코드 코드 포인트로 표현되는 문자 단위입니다. Python 3에서 사용됩니다. |
utf16CodeUnit |
string |
16비트 유니코드 코드 단위로 표현되는 문자 단위입니다. JavaScript, Java 및 .NET에서 사용됩니다. |