Model payStub funkce Document Intelligence
Model payStub funkce Document Intelligence kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení, které analyzují a extrahují údaje o kompenzacích a příjmech z výplatových skluzů. Rozhraní API analyzuje dokumenty a soubory s informacemi souvisejícími s mzdami; extrahuje klíčové informace a vrátí strukturovanou reprezentaci dat JSON.
Funkce | version | ID modelu |
---|---|---|
model payStub | v4.0: 2024-11-30 (GA) | prebuilt-payStub.us |
Vyzkoušení extrakce dat s procedurou PayStub
Mzdové zástupné procedury jsou základní dokumenty vydané zaměstnavateli zaměstnancům, poskytování příjmů, odpočtů a čistých mzdových informací pro konkrétní výplatní období. Podívejte se, jak se data extrahují pomocí prebuilt-payStub.us
modelu. Potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Document Intelligence Studio
Na domovské stránce nástroje Document Intelligence Studio vyberte payStub.
Můžete analyzovat ukázkovou proceduru plateb nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Požadavky na vstup
Podporované formáty souborů:
Model PDF Obrázek: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
systém Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a
4
MB pro bezplatnou úroveň (F0).Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
bodě textu na 150 bodů na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a
1
GB pro neurální model.Pro trénování modelu vlastní klasifikace je
1
celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je2
celková velikost trénovacích dat GB s maximálně 10 000 stránkami.
Podporované jazyky a národní prostředí
Úplný seznam podporovaných jazyků najdete na naší stránce podpory předem připravených jazyků modelu.
Extrakce polí
Podporovaná pole pro extrakci dokumentů najdete na stránce schématu modelu payStub v našem ukázkovém úložišti GitHubu.
Podporovaná národní prostředí
Verze prebuilt-payStub.us podporuje národní prostředí en-us .
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty .
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.