Modely daňových dokumentů Document Intelligence v USA
Tento obsah se vztahuje na: v4.0 (GA) | Předchozí verze: v3.1 (GA) :::moniker-end
Tento obsah se vztahuje na: v3.1 (GA) | Nejnovější verze: v4.0 (GA)
Daňový model Document Intelligence používá výkonné funkce optického rozpoznávání znaků (OCR) k analýze a extrakci klíčových polí a řádkových položek z vybrané skupiny daňových dokladů. Daňové doklady můžou mít různé formáty jako 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. Vstupní formát může zahrnovat obrázky zachycené telefonem, naskenované dokumenty a digitální soubory PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje určité formáty anglického daňového dokladu.
Podporované typy daňových formulářů:
- Sjednocená daň USA
- Daňové přiznání
- 1098
- 1098-E
- 1098-T
- 1099 a varianty (přidáno 1099-SSA)
- 1040 a varianty
- 1095A, 1095C
- W-4
Automatizované zpracování daňových dokumentů
Automatizované zpracování daňových dokladů je proces extrakce klíčových polí z daňových dokladů. V minulosti byly daňové doklady zpracovány ručně. Tento model umožňuje snadnou automatizaci daňových scénářů.
Sjednocená daň USA
Předem Unified US Tax
vytvořený model automaticky rozpozná a extrahuje data z W2
, 1098
, 1040
a 1099
daňových formulářů v odeslaných dokumentech. Tyto dokumenty se dají skládat z mnoha daňových nebo nezadaněných dokumentů. Model zpracovává pouze formuláře, které podporuje.
Možnosti vývoje
Document Intelligence v4.0: 2024-11-30 (GA) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Modely daňových formulářů USA | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
• prebuilt-tax.us• předem připravená-tax.us.W-2 • předem připravená-tax.us.W-4 • předem připravená verze-tax.us.1095A • předem připravená-tax.us.1095C • předem sestavený-tax.us.1098 • předem připravený-tax.us.1098E • předem sestavený-tax.us.1098T • předem připravený-tax.us.. 1099A • předem připravená-tax.us.1099B • předem připravená-tax.us.1099C • předem připravená-tax.us.1099CAP • předem připravená daň.us.1099Combo • prebuilt-tax.us.1099DIV • prebuilt-tax.us.1099G • prebuilt-tax.us.1099H • prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K • prebuilt-tax.us.1099LS • prebuilt-tax.us.us.1099LTC • předem připravená-tax.us.1099MISC • předem připravená-tax.us.1099NEC • předem připravená-tax.us.1099OID• předem připravená-tax.us.1099OID • předem připravená-tax.us.1 1099PATR • předem připravená verze-tax.us.1099Q • předem připravená-tax.us.1099QA • předem připravená-tax.us.1099R • předem připravená daň.us.1099S • předem připravená-tax.us.1099SA • předem připravená-tax.us.1099SB • předem připravená-tax.us.1099SSA • prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1 • prebuilt-tax.us.1040Schedule2 • předem připravená daň.us.1040Schedule3 • předem připravená-tax.us.1040Schedule8812 • prebuilt-tax.us.1040ScheduleA • prebubuilt-tax.us.1040ScheduleB • prebuilt-tax.us.1040ScheduleC • prebuilt-tax.us.1040ScheduleD• prebuilt-tax.us.1040ScheduleD • předemilt-tax.us.1040ScheduleE • předem připravený-tax.us.1040ScheduleEIC • předem sestavený-tax.us.1040ScheduleF • prebuilt-tax.us.1040ScheduleH • prebuilt-tax.us.1040ScheduleJ • prebuilt-tax.us.1040ScheduleR • prebuilt-tax.us.1040ScheduleSE • prebuilt-tax.us.1040Senior |
Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Modely daňových formulářů USA | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
• předem připravená verze-tax.us.W-2 • předem připravená-tax.us.1098 • předem připravená-tax.us.1098E • předem připravená-tax.us.1098T |
Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Modely daňových formulářů USA | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
• předem připravená verze-tax.us.W-2 • předem připravená-tax.us.1098 • předem připravená-tax.us.1098E • předem připravená-tax.us.1098T |
Požadavky na vstup
Podporované formáty souborů:
Model PDF Obrázek: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
systém Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a
4
MB pro bezplatnou úroveň (F0).Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
bodě textu na 150 bodů na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a
1
GB pro neurální model.Pro trénování modelu vlastní klasifikace je
1
celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je2
celková velikost trénovacích dat GB s maximálně 10 000 stránkami.
Vyzkoušení extrakce údajů o daňových dokladech
Podívejte se, jak se data, včetně informací o zákaznících, podrobností o dodavateli a řádkových položek, extrahují z faktur. Potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Document Intelligence Studio
Na domovské stránce nástroje Document Intelligence Studio vyberte podporovaný model daňového dokladu.
Můžete analyzovat ukázkový daňový doklad nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Podporované jazyky a národní prostředí
Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .
Extrakce polí
Podporovaná pole pro extrakci dokumentů najdete na stránkách schématu modelu daňového dokumentu v našem ukázkovém úložišti GitHubu.
Páry klíč-hodnota daňových dokladů a extrahované řádkové položky jsou v documentResults
části výstupu JSON.
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.