Obecný model dokumentu Document Intelligence
Důležité
Počínaje verzemi Document Intelligence verze v4.0 preview a v budoucnu je obecný model dokumentu (předem vytvořený dokument) zastaralý. Pokud chcete extrahovat páry klíč-hodnota, značky výběru, text, tabulky a strukturu z dokumentů, použijte následující modely:
Funkce | version | ID modelu |
---|---|---|
Layout model s povoleným volitelným parametrem features=keyValuePairs řetězce dotazu. |
• v4:2024-02-29-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Obecný model dokumentu | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-document |
Obecný model dokumentů kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení k extrakci párů klíč-hodnota, tabulek a výběrových z dokumentů. Obecný dokument je k dispozici s rozhraními API v3.1 a v3.0. Další informace najdete v našem průvodci migrací.
Obecné funkce dokumentů
Obecný model dokumentu je předem natrénovaný model; nevyžaduje popisky ani trénování.
Jedno rozhraní API extrahuje páry klíč-hodnota, značky výběru, text, tabulky a strukturu z dokumentů.
Obecný model dokumentů podporuje strukturované, částečně strukturované a nestrukturované dokumenty.
Značky výběru jsou identifikovány jako pole s hodnotou
:selected:
nebo:unselected:
.
Ukázkový dokument zpracovaný v nástroji Document Intelligence Studio
Extrakce páru klíč-hodnota
Obecné rozhraní API dokumentů podporuje většinu typů formulářů a analyzuje dokumenty a extrahuje klíče a přidružené hodnoty. Je ideální pro extrakci běžných párů klíč-hodnota z dokumentů. Obecný model dokumentu můžete použít jako alternativu k trénování vlastního modelu bez popisků.
Možnosti vývoje
Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Obecný model dokumentu | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
předem připravený dokument |
Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Obecný model dokumentu | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
předem připravený dokument |
Požadavky na vstup
Podporované formáty souborů:
Model PDF Obrázek: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
systém Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a
4
MB pro bezplatnou úroveň (F0).Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
bodě textu na 150 bodů na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a
1
GB pro neurální model.Pro trénování modelu vlastní klasifikace je
1
celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je2
celková velikost trénovacích dat GB s maximálně 10 000 stránkami.
Obecné extrakce dat modelu dokumentů
Zkuste extrahovat data z formulářů a dokumentů pomocí nástroje Document Intelligence Studio.
Potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Poznámka:
Sada Document Intelligence Studio a obecný model dokumentů jsou k dispozici s rozhraním API verze 3.0.
Na domovské stránce nástroje Document Intelligence Studio vyberte Obecné dokumenty.
Můžete analyzovat ukázkový dokument nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Páry klíč-hodnota
Páry klíč-hodnota jsou specifické rozsahy v dokumentu, které identifikují popisek nebo klíč a jeho přidruženou odpověď nebo hodnotu. Ve strukturovaném formuláři můžou být tyto páry popiskem a hodnotou, kterou uživatel zadal pro toto pole. V nestrukturovaném dokumentu můžou být datum, kdy byla smlouva provedena na základě textu v odstavci. Model AI se vytrénuje tak, aby extrahovala identifikovatelné klíče a hodnoty na základě široké škály typů dokumentů, formátů a struktur.
Klíče mohou existovat také izolovaně, když model zjistí, že klíč existuje, bez přidružené hodnoty nebo při zpracování volitelných polí. Například pole s prostředním názvem může být v některých případech prázdné ve formuláři. Páry klíč-hodnota jsou rozsahy textu obsaženého v dokumentu. U dokumentů, ve kterých je stejná hodnota popsaná různými způsoby, například zákazník/uživatel, je přidruženým klíčem zákazník nebo uživatel (na základě kontextu).
Extrakce dat
Model | Extrakce textu | Páry klíč-hodnota | Značky výběru | Tabulky | Běžné názvy |
---|---|---|---|---|---|
Obecný dokument | ✓ | ✓ | ✓ | ✓ | ✓* |
{* – k dispozici pouze ve 2023-07-31
verzích (GA verze 3.1) a novějších verzích rozhraní API.
Podporované jazyky a národní prostředí
Úplný seznam podporovaných jazyků najdete na stránce s modely analýzy dokumentů.
Důležité informace
Vzhledem k tomu, že klíče jsou rozložené na text extrahovaný z dokumentu, musí být klíče pro částečně strukturované dokumenty namapované na existující slovník klíčů.
Očekává se, že se zobrazí páry klíč-hodnota s klíčem, ale žádná hodnota. Pokud se například uživatel rozhodl, že ve formuláři nezadá e-mailovou adresu.
Další kroky
Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.1 ve vašich aplikacích a pracovních postupech.
Prozkoumejte naše rozhraní REST API.