다음을 통해 공유


문서 인텔리전스 미국 세금 문서 모델

이 콘텐츠는확인 표시 v4.0(GA) | 이전 버전:파란색 확인 표시 v3.1(GA) :::moniker-end에 적용됩니다.

이 콘텐츠는 확인 표시 v3.1(GA) | 최신 버전: 보라색 확인 표시 v4.0(GA)에 적용됩니다.

문서 인텔리전스 세금 모델은 강력한 OCR(광학 인식) 기능을 사용하여 선택한 세금 문서 그룹에서 키 필드와 품목을 분석하고 추출합니다. 세금 문서는 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA와 같은 다양한 형식일 수 있습니다. 입력 형식에는 휴대폰 캡처 이미지, 스캔한 문서 및 디지털 PDF가 포함될 수 있습니다. API는 문서 텍스트를 분석합니다. 키 정보를 추출하고 구조화된 JSON 데이터 표현을 반환합니다. 이 모델은 현재 특정 영어 세금 문서 형식을 지원합니다.

지원되는 세금 양식 유형:

  • 통합 세금 미국
  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 및 변형(1099-SSA 추가)
  • 1040 및 변형
  • 1095A, 1095C
  • W-4

자동화된 세금 문서 처리

자동화된 세금 문서 처리는 세금 문서에서 주요 필드를 추출하는 프로세스입니다. 과거에는 세금 문서가 수동으로 처리되었습니다. 이 모델을 사용하면 세금 시나리오를 쉽게 자동화할 수 있습니다.

통합 세금 미국

Unified US Tax 미리 빌드된 모델은 제출된 문서의 , 및 1040세금 양식에서 W21098데이터를 자동으로 검색하고 1099 추출합니다. 이러한 문서는 여러 세금 또는 비과세 관련 문서로 구성될 수 있습니다. 모델은 지원하는 양식만 처리합니다.

통합 세금 처리 다이어그램의 스크린샷

개발 옵션

문서 인텔리전스 v4.0: 2024-11-30 (GA)은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능 리소스 Model ID
미국 세금 양식 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us
• 미리 빌드된-tax.us.W-2
• 미리 빌드된-tax.us.W-4
• 미리 빌드된-tax.us.1095A
• 미리 빌드된-tax.us.109 5C
• 미리 빌드된-tax.us.1098
• 미리 빌드된-tax.us.1098E
• 미리 빌드된-tax.us.1098T
• 미리 빌드된-tax.us.1099A
• 미리 빌드된-tax.us.1099B
• 미리 빌드된-tax.us.1099C
• 미리 빌드된-tax.us.1099CAP
• 미리 빌드된 세금입니다. us.1099Combo
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H
• prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• 미리 빌드된 tax.us.1099MISC
• 미리 빌드된-tax.us.1099NEC
• 미리 빌드된-tax.us.1099OID
• 미리 빌드된-tax.us.us.. 1099PATR
• 미리 빌드된-tax.us.1099Q
• 미리 빌드된-tax.us.1099QA
• 미리 빌드된-tax.us.1099R
• 미리 빌드된-tax.us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1099SSA

prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF

prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

문서 인텔리전스 v3.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
미국 세금 양식 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

문서 인텔리전스 v3.0은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
미국 세금 양식 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

입력 요구 사항

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX), HTML
    읽기
    레이아웃
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류
  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB이고 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8점 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB이고 인공신경망 모델의 경우 1GB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 1GB이고 최대 10,000페이지입니다. 2024-11-30(GA)의 경우 학습 데이터의 총 크기는 최대 10,000페이지의 GB입니다 2 .

세금 문서 데이터 추출을 사용해 보세요

고객 정보, 공급업체 세부 정보 및 라인 항목을 포함한 데이터가 청구서에서 추출되는 방법을 확인합니다. 다음 리소스가 필요합니다.

  • Azure 구독은 무료로 만들 수 있습니다.

  • Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

Azure Portal에서 키 및 엔드포인트 위치의 스크린샷

문서 인텔리전스 스튜디오

  1. Document Intelligence Studio 홈페이지에서 지원되는 세금 문서 모델을 선택합니다.

  2. 샘플 세금 문서를 분석하거나 자체 파일을 업로드할 수 있습니다.

  3. 분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

    문서 인텔리전스 스튜디오의 분석 실행과 분석 옵션 버튼 스크린샷.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 언어 지원 - 미리 빌드된 모델 페이지를 참조하세요.

필드 추출

지원되는 문서 추출 필드는 GitHub 샘플 리포지토리의 세금 문서 모델 스키마 페이지를 참조하세요.

추출된 세금 문서 키-값 쌍 및 품목은 JSON 출력의 documentResults 섹션에 있습니다.

다음 단계