Sdílet prostřednictvím


Obecný model dokumentu Document Intelligence

Důležité

Počínaje verzemi Document Intelligence verze v4.0 preview a v budoucnu je obecný model dokumentu (předem vytvořený dokument) zastaralý. Pokud chcete extrahovat páry klíč-hodnota, značky výběru, text, tabulky a strukturu z dokumentů, použijte následující modely:

Funkce version ID modelu
Layout model s povoleným volitelným parametrem features=keyValuePairs řetězce dotazu. • v4:2024-02-29-preview
• v3.1:2023-07-31 (GA)
prebuilt-layout
Obecný model dokumentu • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-document

Tento obsah se vztahuje na: Zaškrtnutí v3.1 (GA) | Nejnovější verze: nachová značka zaškrtnutív4.0 (GA) | Předchozí verze: modrá značka zaškrtnutí v3.0

Tento obsah se vztahuje na: Zaškrtnutí v3.0 (GA) | Nejnovější verze:nachová značka zaškrtnutí v4.0 (GA)nachová značka zaškrtnutí v3.1

Obecný model dokumentů kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení k extrakci párů klíč-hodnota, tabulek a výběrových z dokumentů. Obecný dokument je k dispozici s rozhraními API v3.1 a v3.0. Další informace najdete v našem průvodci migrací.

Obecné funkce dokumentů

  • Obecný model dokumentu je předem natrénovaný model; nevyžaduje popisky ani trénování.

  • Jedno rozhraní API extrahuje páry klíč-hodnota, značky výběru, text, tabulky a strukturu z dokumentů.

  • Obecný model dokumentů podporuje strukturované, částečně strukturované a nestrukturované dokumenty.

  • Značky výběru jsou identifikovány jako pole s hodnotou :selected: nebo :unselected:.

Ukázkový dokument zpracovaný v nástroji Document Intelligence Studio

Snímek obrazovky s obecnou analýzou dokumentu v nástroji Document Intelligence Studio

Extrakce páru klíč-hodnota

Obecné rozhraní API dokumentů podporuje většinu typů formulářů a analyzuje dokumenty a extrahuje klíče a přidružené hodnoty. Je ideální pro extrakci běžných párů klíč-hodnota z dokumentů. Obecný model dokumentu můžete použít jako alternativu k trénování vlastního modelu bez popisků.

Možnosti vývoje

Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Obecný model dokumentu Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravený dokument

Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Obecný model dokumentu Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravený dokument

Požadavky na vstup

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Čteno
    Rozložení
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace
  • Nejlepšíchvýsledkůch

  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

Obecné extrakce dat modelu dokumentů

Zkuste extrahovat data z formulářů a dokumentů pomocí nástroje Document Intelligence Studio.

Potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Poznámka:

Sada Document Intelligence Studio a obecný model dokumentů jsou k dispozici s rozhraním API verze 3.0.

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte Obecné dokumenty.

  2. Můžete analyzovat ukázkový dokument nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Páry klíč-hodnota

Páry klíč-hodnota jsou specifické rozsahy v dokumentu, které identifikují popisek nebo klíč a jeho přidruženou odpověď nebo hodnotu. Ve strukturovaném formuláři můžou být tyto páry popiskem a hodnotou, kterou uživatel zadal pro toto pole. V nestrukturovaném dokumentu můžou být datum, kdy byla smlouva provedena na základě textu v odstavci. Model AI se vytrénuje tak, aby extrahovala identifikovatelné klíče a hodnoty na základě široké škály typů dokumentů, formátů a struktur.

Klíče mohou existovat také izolovaně, když model zjistí, že klíč existuje, bez přidružené hodnoty nebo při zpracování volitelných polí. Například pole s prostředním názvem může být v některých případech prázdné ve formuláři. Páry klíč-hodnota jsou rozsahy textu obsaženého v dokumentu. U dokumentů, ve kterých je stejná hodnota popsaná různými způsoby, například zákazník/uživatel, je přidruženým klíčem zákazník nebo uživatel (na základě kontextu).

Extrakce dat

Model Extrakce textu Páry klíč-hodnota Značky výběru Tabulky Běžné názvy
Obecný dokument ✓*

{* – k dispozici pouze ve 2023-07-31 verzích (GA verze 3.1) a novějších verzích rozhraní API.

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na stránce s modely analýzy dokumentů.

Důležité informace

  • Vzhledem k tomu, že klíče jsou rozložené na text extrahovaný z dokumentu, musí být klíče pro částečně strukturované dokumenty namapované na existující slovník klíčů.

  • Očekává se, že se zobrazí páry klíč-hodnota s klíčem, ale žádná hodnota. Pokud se například uživatel rozhodl, že ve formuláři nezadá e-mailovou adresu.

Další kroky

  • Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.1 ve vašich aplikacích a pracovních postupech.

  • Prozkoumejte naše rozhraní REST API.