Sdílet prostřednictvím


Modely daňových dokumentů Document Intelligence v USA

Tento obsah se vztahuje na: Zaškrtnutí v4.0 (GA) | Předchozí verze: modrá značka zaškrtnutív3.1 (GA) :::moniker-end

Tento obsah se vztahuje na:Zaškrtnutí v3.1 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (GA)

Daňový model Document Intelligence používá výkonné funkce optického rozpoznávání znaků (OCR) k analýze a extrakci klíčových polí a řádkových položek z vybrané skupiny daňových dokladů. Daňové doklady můžou mít různé formáty jako 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. Vstupní formát může zahrnovat obrázky zachycené telefonem, naskenované dokumenty a digitální soubory PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje určité formáty anglického daňového dokladu.

Podporované typy daňových formulářů:

  • Sjednocená daň USA
  • Daňové přiznání
  • 1098
  • 1098-E
  • 1098-T
  • 1099 a varianty (přidáno 1099-SSA)
  • 1040 a varianty
  • 1095A, 1095C
  • W-4

Automatizované zpracování daňových dokumentů

Automatizované zpracování daňových dokladů je proces extrakce klíčových polí z daňových dokladů. V minulosti byly daňové doklady zpracovány ručně. Tento model umožňuje snadnou automatizaci daňových scénářů.

Sjednocená daň USA

Předem Unified US Tax vytvořený model automaticky rozpozná a extrahuje data z W2, 1098, 1040a 1099 daňových formulářů v odeslaných dokumentech. Tyto dokumenty se dají skládat z mnoha daňových nebo nezadaněných dokumentů. Model zpracovává pouze formuláře, které podporuje.

Snímek obrazovky s diagramem sjednoceného daňového zpracování

Možnosti vývoje

Document Intelligence v4.0: 2024-11-30 (GA) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Modely daňových formulářů USA Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
• prebuilt-tax.us• předem připravená-tax.us.W-2
• předem připravená-tax.us.W-4
• předem připravená verze-tax.us.1095A
• předem připravená-tax.us.1095C
• předem sestavený-tax.us.1098
• předem připravený-tax.us.1098E
• předem sestavený-tax.us.1098T
• předem připravený-tax.us.. 1099A
• předem připravená-tax.us.1099B
• předem připravená-tax.us.1099C
• předem připravená-tax.us.1099CAP
• předem připravená daň.us.1099Combo
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H

prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.us.1099LTC
• předem připravená-tax.us.1099MISC
• předem připravená-tax.us.1099NEC
• předem připravená-tax.us.1099OID• předem připravená-tax.us.1099OID
• předem připravená-tax.us.1 1099PATR
• předem připravená verze-tax.us.1099Q
• předem připravená-tax.us.1099QA
• předem připravená-tax.us.1099R
• předem připravená daň.us.1099S
• předem připravená-tax.us.1099SA
• předem připravená-tax.us.1099SB
• předem připravená-tax.us.1099SSA

prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• předem připravená daň.us.1040Schedule3
• předem připravená-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA
• prebubuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD• prebuilt-tax.us.1040ScheduleD
• předemilt-tax.us.1040ScheduleE
• předem připravený-tax.us.1040ScheduleEIC
• předem sestavený-tax.us.1040ScheduleF

prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Modely daňových formulářů USA Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
• předem připravená verze-tax.us.W-2
• předem připravená-tax.us.1098
• předem připravená-tax.us.1098E
• předem připravená-tax.us.1098T

Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Modely daňových formulářů USA Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
• předem připravená verze-tax.us.W-2
• předem připravená-tax.us.1098
• předem připravená-tax.us.1098E
• předem připravená-tax.us.1098T

Požadavky na vstup

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Čteno
    Rozložení
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace
  • Nejlepšíchvýsledkůch

  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

Vyzkoušení extrakce údajů o daňových dokladech

Podívejte se, jak se data, včetně informací o zákaznících, podrobností o dodavateli a řádkových položek, extrahují z faktur. Potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Document Intelligence Studio

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte podporovaný model daňového dokladu.

  2. Můžete analyzovat ukázkový daňový doklad nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .

Extrakce polí

Podporovaná pole pro extrakci dokumentů najdete na stránkách schématu modelu daňového dokumentu v našem ukázkovém úložišti GitHubu.

Páry klíč-hodnota daňových dokladů a extrahované řádkové položky jsou v documentResults části výstupu JSON.

Další kroky