문서 인텔리전스 미국 세금 문서 모델
이 콘텐츠는 v4.0(GA) | 이전 버전: v3.1(GA) :::moniker-end에 적용됩니다.
이 콘텐츠는 v3.1(GA) | 최신 버전: v4.0(GA)에 적용됩니다.
문서 인텔리전스 세금 모델은 강력한 OCR(광학 인식) 기능을 사용하여 선택한 세금 문서 그룹에서 키 필드와 품목을 분석하고 추출합니다. 세금 문서는 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA와 같은 다양한 형식일 수 있습니다. 입력 형식에는 휴대폰 캡처 이미지, 스캔한 문서 및 디지털 PDF가 포함될 수 있습니다. API는 문서 텍스트를 분석합니다. 키 정보를 추출하고 구조화된 JSON 데이터 표현을 반환합니다. 이 모델은 현재 특정 영어 세금 문서 형식을 지원합니다.
지원되는 세금 양식 유형:
- 통합 세금 미국
- W-2
- 1098
- 1098-E
- 1098-T
- 1099 및 변형(1099-SSA 추가)
- 1040 및 변형
- 1095A, 1095C
- W-4
자동화된 세금 문서 처리
자동화된 세금 문서 처리는 세금 문서에서 주요 필드를 추출하는 프로세스입니다. 과거에는 세금 문서가 수동으로 처리되었습니다. 이 모델을 사용하면 세금 시나리오를 쉽게 자동화할 수 있습니다.
통합 세금 미국
Unified US Tax
미리 빌드된 모델은 제출된 문서의 , 및 1040
세금 양식에서 W2
1098
데이터를 자동으로 검색하고 1099
추출합니다. 이러한 문서는 여러 세금 또는 비과세 관련 문서로 구성될 수 있습니다. 모델은 지원하는 양식만 처리합니다.
개발 옵션
문서 인텔리전스 v4.0: 2024-11-30 (GA)은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
기능 | 리소스 | Model ID |
---|---|---|
미국 세금 양식 모델 | • 문서 인텔리전스 스튜디오 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us • 미리 빌드된-tax.us.W-2 • 미리 빌드된-tax.us.W-4 • 미리 빌드된-tax.us.1095A • 미리 빌드된-tax.us.109 5C • 미리 빌드된-tax.us.1098 • 미리 빌드된-tax.us.1098E • 미리 빌드된-tax.us.1098T • 미리 빌드된-tax.us.1099A • 미리 빌드된-tax.us.1099B • 미리 빌드된-tax.us.1099C • 미리 빌드된-tax.us.1099CAP • 미리 빌드된 세금입니다. us.1099Combo • prebuilt-tax.us.1099DIV • prebuilt-tax.us.1099G • prebuilt-tax.us.1099H • prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K • prebuilt-tax.us.1099LS • prebuilt-tax.us.1099LTC • 미리 빌드된 tax.us.1099MISC • 미리 빌드된-tax.us.1099NEC • 미리 빌드된-tax.us.1099OID • 미리 빌드된-tax.us.us.. 1099PATR • 미리 빌드된-tax.us.1099Q • 미리 빌드된-tax.us.1099QA • 미리 빌드된-tax.us.1099R • 미리 빌드된-tax.us.1099S • prebuilt-tax.us.1099SA • prebuilt-tax.us.1099SB • prebuilt-tax.us.1099SSA • prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1 • prebuilt-tax.us.1040Schedule2 • prebuilt-tax.us.1040Schedule3 • prebuilt-tax.us.1040Schedule8812 • prebuilt-tax.us.1040ScheduleA • prebuilt-tax.us.1040ScheduleB • prebuilt-tax.us.1040ScheduleC • prebuilt-tax.us.1040ScheduleD • prebuilt-tax.us.1040ScheduleE • prebuilt-tax.us.1040ScheduleEIC • prebuilt-tax.us.1040ScheduleF • prebuilt-tax.us.1040ScheduleH • prebuilt-tax.us.1040ScheduleJ • prebuilt-tax.us.1040ScheduleR • prebuilt-tax.us.1040ScheduleSE • prebuilt-tax.us.1040Senior |
문서 인텔리전스 v3.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.
기능 | 리소스 | Model ID |
---|---|---|
미국 세금 양식 모델 | • 문서 인텔리전스 스튜디오 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us.W-2 • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T |
문서 인텔리전스 v3.0은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.
기능 | 리소스 | Model ID |
---|---|---|
미국 세금 양식 모델 | • 문서 인텔리전스 스튜디오 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us.W-2 • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T |
입력 요구 사항
지원 파일 형식:
모델 PDF 이미지: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word(DOCX
), Excel(XLSX
), PowerPoint(PPTX
), HTML읽기 ✔ ✔ ✔ 레이아웃 ✔ ✔ ✔ 일반 문서 ✔ ✔ 사전 제작 ✔ ✔ 사용자 지정 추출 ✔ ✔ 사용자 지정 분류 ✔ ✔ ✔ 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.
PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).
문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB이고 무료(F0) 계층의 경우
4
MB입니다.이미지 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.
PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.
추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약
8
점 텍스트에 해당합니다.사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.
사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB이고 인공신경망 모델의 경우
1
GB입니다.사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는
1
GB이고 최대 10,000페이지입니다. 2024-11-30(GA)의 경우 학습 데이터의 총 크기는 최대 10,000페이지의 GB입니다2
.
세금 문서 데이터 추출을 사용해 보세요
고객 정보, 공급업체 세부 정보 및 라인 항목을 포함한 데이터가 청구서에서 추출되는 방법을 확인합니다. 다음 리소스가 필요합니다.
Azure 구독은 무료로 만들 수 있습니다.
Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(
F0
)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.
문서 인텔리전스 스튜디오
Document Intelligence Studio 홈페이지에서 지원되는 세금 문서 모델을 선택합니다.
샘플 세금 문서를 분석하거나 자체 파일을 업로드할 수 있습니다.
분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.
지원되는 언어 및 로캘
지원되는 언어의 전체 목록은 언어 지원 - 미리 빌드된 모델 페이지를 참조하세요.
필드 추출
지원되는 문서 추출 필드는 GitHub 샘플 리포지토리의 세금 문서 모델 스키마 페이지를 참조하세요.
추출된 세금 문서 키-값 쌍 및 품목은 JSON 출력의 documentResults
섹션에 있습니다.
다음 단계
문서 인텔리전스 스튜디오를 사용하여 사용자 고유의 양식 및 문서를 처리해 보세요.
Document Intelligence 빠른 시작을 완료하고 원하는 개발 언어로 문서 처리 앱 만들기를 시작해 보세요.