Sdílet prostřednictvím


Modely zpracování dokumentů

Tento obsah se vztahuje na: Zaškrtnutí v4.0 (GA) | Předchozí verze:modrá značka zaškrtnutí v3.1 (GA) modrá značka zaškrtnutí v3.0 (GA)modrá značka zaškrtnutí v2.1 (GA)

Tento obsah se vztahuje na: Zaškrtnutí v3.1 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (GA) | Předchozí verze: modrá značka zaškrtnutí v3.0modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na:Zaškrtnutí v3.0 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (GA) nachová značka zaškrtnutív3.1 | Předchozí verze: modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na: Zaškrtnutí v2.1 | Nejnovější verze: modrá značka zaškrtnutí v4.0 (GA)

Azure AI Document Intelligence podporuje širokou škálu modelů, které umožňují přidat inteligentní zpracování dokumentů do aplikací a toků. Můžete použít předem vytvořený model specifický pro doménu nebo vytrénovat vlastní model přizpůsobený konkrétním obchodním potřebám a případům použití. Funkce Document Intelligence se dá použít s rozhraním REST API nebo pythonem, C#, Javou a javascriptovými klientskými knihovnami.

Poznámka:

  • Projekty zpracování dokumentů, které zahrnují finanční data, chráněná zdravotní data, osobní údaje nebo vysoce citlivá data, vyžadují pečlivou pozornost.
  • Ujistěte se, že splňuje všechny požadavky specifické pro národní/regionální a průmyslové odvětví.

Přehled modelů

Následující tabulka uvádí dostupné modely pro každé stabilní rozhraní API:

Typ modelu Model 30.11.2024 (GA) 31. 7. 2023 (GA) 31. 8. 2022 (GA) v2.1 (GA)
Modely analýzy dokumentů Přečíst ✔️ ✔️ ✔️ Není k dispozici
Modely analýzy dokumentů Rozložení ✔️ ✔️ ✔️ ✔️
Modely analýzy dokumentů Obecný dokument přesunuto do rozložení** ✔️ ✔️ Není k dispozici
Předem vytvořené modely Bankovní šek ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Bankovní výpis ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Paystub ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Smlouva ✔️ ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Zdravotní pojištění ✔️ ✔️ ✔️ Není k dispozici
Předem vytvořené modely Průkaz totožnosti ✔️ ✔️ ✔️ ✔️
Předem vytvořené modely Faktura ✔️ ✔️ ✔️ ✔️
Předem vytvořené modely Paragon ✔️ ✔️ ✔️ ✔️
Předem vytvořené modely Sjednocená daň USA* ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely US 1040 Tax* ✔️ ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely US 1095 Tax* ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely US 1098 Tax* ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely US 1099 Tax* ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely US W2 Tax ✔️ ✔️ ✔️ Není k dispozici
Předem vytvořené modely US W4 Tax ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely US Hypotéka 1003 URLA ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely US Hypotéka 1004 URAR ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Americká hypotéka 1005 ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Us Hypotéka 1008 Souhrn ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Zveřejnění uzavírací hypotéky v USA ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Manželství certifikátu ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Platební karta ✔️ Není k dispozici Není k dispozici
Předem vytvořené modely Vizitka deprecated ✔️ ✔️ ✔️
Vlastní klasifikační model Vlastní klasifikátor ✔️ ✔️ Není k dispozici Není k dispozici
Vlastní model extrakce Vlastní neurální ✔️ ✔️ ✔️ Není k dispozici
Vlastní model extrakce Vlastní šablona ✔️ ✔️ ✔️ ✔️
Vlastní model extrakce Vlastní složené ✔️ ✔️ ✔️ ✔️
Všechny modely Možnosti doplňků ✔️ ✔️ Není k dispozici Není k dispozici

* - Obsahuje podmodely. Informace o podporovaných variantáchachch
**- Všechny možnosti modelu obecného dokumentu jsou k dispozici v modelu rozložení. Obecný model se už nepodporuje.

Latence

Latence je doba, kterou vyžaduje, aby server rozhraní API zpracovával a zpracovával příchozí požadavek a doručil odchozí odpověď klientovi. Doba analýzy dokumentu závisí na jeho velikosti (například počtu stránek) a souvisejícím obsahu na každé stránce. Funkce Document Intelligence je víceklientská služba, kde latence podobných dokumentů je srovnatelná, ale ne vždy identická. Občasná proměnlivost latence a výkonu je nedílnou součástí jakékoli bezstavové asynchronní služby založené na mikroslužbách, která zpracovává obrázky a velké dokumenty ve velkém měřítku. I když nepřetržitě vertikálně navyšujeme kapacitu hardwaru a kapacitu a možnosti škálování, můžete stále mít problémy s latencí za běhu.

Funkce doplňku

Následují možnosti doplňku, které jsou k dispozici v nástroji Document Intelligence. U všech modelů kromě modelu vizitek teď funkce Document Intelligence podporuje funkce doplňků, které umožňují sofistikovanější analýzu. Tyto volitelné funkce je možné povolit a zakázat v závislosti na scénáři extrakce dokumentů. Pro verzi rozhraní API (GA) a novějších verzí rozhraní API je k dispozici 2023-07-31 sedm možností doplňků:

Funkce doplňku Doplněk nebo zdarma 30.11.2024 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Extrakce vlastností písma Doplněk ✔️ ✔️ Není k dispozici Není k dispozici
Extrakce vzorců Doplněk ✔️ ✔️ Není k dispozici Není k dispozici
Extrakce s vysokým rozlišením Doplněk ✔️ ✔️ Není k dispozici Není k dispozici
Extrakce čárových kódů Bezplatný ✔️ ✔️ Není k dispozici Není k dispozici
Rozpoznávání jazyka Bezplatný ✔️ ✔️ Není k dispozici Není k dispozici
Páry klíč-hodnota Bezplatný ✔️ Není k dispozici Není k dispozici
Pole dotazu Doplněk* ✔️ Není k dispozici Není k dispozici
Prohledávatelný pdf Doplněk* ✔️ Není k dispozici Není k dispozici

Funkce analýzy modelů

ID modelu Extrakce obsahu Pole dotazu Odstavce Role odstavce Značky výběru Tabulky Páry klíč-hodnota Jazyky Čárové kódy Analýza dokumentů Formule* Písmo stylu* Vysoké rozlišení* Prohledávatelný SOUBOR PDF
předem připravená čtení O O O O O O
předem připravené rozložení O O O O O O
předem připravená smlouva O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
předem připravená faktura O O O O O O
předem připravená potvrzení O O O O O
prebuilt-marriageCertificate.us O O O O O
předem připravená platební karta O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
předem připravená hypotéka.us.1003 O O O O O
předem připravená hypotéka.us.1004 O O O O O
předem připravená hypotéka.us.1005 O O O O O
předem připravená hypotéka.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (různé) O O O O O
předem připravená-tax.us.1095A O O O O O
předem připravená-tax.us.1095C O O O O O
předem připravená-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (různé) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

%% - Enabled
O - Optional
* - Premium features incur extra costs

Add-On* – Pole dotazu se za ceny liší od ostatních funkcí doplňku. Podrobnosti najdete na stránce s cenami .

Ohraničující rámeček a mnohoúhelníkové souřadnice

Ohraničující rámeček (polygon ve verzi v3.0 a novějších verzích) je abstraktní obdélník, který obklopuje textové prvky v dokumentu používaném jako referenční bod pro detekci objektů.

  • Ohraničující rámeček určuje pozici pomocí souřadnicové roviny x a y zobrazené v matici čtyř číselných párů. Každý pár představuje roh pole v následujícím pořadí: vlevo nahoře, vpravo nahoře, vpravo dole, vlevo dole.

  • Souřadnice obrázků se zobrazují v pixelech. V případě PDF jsou souřadnice prezentovány v palcích.

Podpora jazyků

Univerzální modely založené na hlubokém učení ve funkci Document Intelligence podporují mnoho jazyků, které můžou extrahovat vícejazyčný text z obrázků a dokumentů, včetně textových čar se smíšenými jazyky. Podpora jazyků se liší podle funkcí služby Document Intelligence. Úplný seznam najdete v následujících článcích:

Regionální dostupnost

Funkce Document Intelligence je obecně dostupná v mnoha oblastech globální infrastruktury Azure 60 a více.

Další informace najdete na naší stránce geografických oblastí Azure, která vám a vašim zákazníkům pomůže vybrat oblast, která je pro vás a vaše zákazníky nejvhodnější.

Podrobnosti o modelu

Tato část popisuje výstup, který můžete očekávat od každého modelu. Výstup většiny modelů můžete rozšířit o funkce doplňků.

Čtení OCR

Rozhraní API pro čtení analyzuje a extrahuje řádky, slova, jejich umístění, rozpoznané jazyky a ručně psaný styl v případě zjištění.

Ukázkový dokument zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s snímkem obrazovky s ukázkovým dokumentem zpracovaným pomocí nástroje Document Intelligence Studio read

Analýza rozložení

Model analýzy rozložení analyzuje a extrahuje text, tabulky, značky výběru a další prvky struktury, jako jsou názvy, nadpisy oddílů, záhlaví stránek, zápatí stránek a další.

Ukázkový dokument zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovou stránkou novin zpracovaných pomocí nástroje Document Intelligence Studio

Zdravotní pojištění

Model zdravotní karty kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení k analýze a extrakci klíčových informací z amerických zdravotních pojištění.

Ukázka americké zdravotní pojištění zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovou analýzou karty zdravotní pojištění v USA v nástroji Document Intelligence Studio

Daňové doklady USA

Modely daňových dokumentů USA analyzují a extrahují klíčová pole a řádkové položky z vybrané skupiny daňových dokladů. Rozhraní API podporuje analýzu daňových dokumentů usa v angličtině různých formátů a kvality, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních pdf souborů. V současné době se podporují následující modely:

Model Popis ID modelu
US Tax W-2 Extrahování podrobností o kompenzaci k dani. prebuilt-tax.us.w2
US Tax W-4 Extrahování podrobností o kompenzaci k dani. prebuilt-tax.us.w4
US Tax 1040 Extrahujte podrobnosti o hypotékách. prebuilt-tax.us.1040(varianty)
US Tax 1095 Extrahujte podrobnosti o zdravotním pojištění. prebuilt-tax.us.1095(varianty)
US Tax 1098 Extrahujte podrobnosti o hypotékách. prebuilt-tax.us.1098(varianty)
US Tax 1099 Extrahujte příjmy získané z jiných zdrojů než zaměstnavatele. prebuilt-tax.us.1099(varianty)

Ukázkový dokument W-2 zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkou W-2

Americké hypotéky dokumenty

Modely dokumentů hypoték v USA analyzují a extrahují klíčová pole, včetně informací o dlužníku, půjčkách a nemovitostech z vybrané skupiny hypoték. Rozhraní API podporuje analýzu amerických hypoték anglického jazyka různých formátů a kvality, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních pdf souborů. V současné době se podporují následující modely:

Model Popis ID modelu
1003 Licenční smlouva s koncovým uživatelem (EULA) Extrahovat půjčku, dlužníka, podrobnosti o nemovitosti. předem připravená hypotéka.us.1003
1004 Uniform Residential Appraisal Report (URAR)) Extrahovat půjčku, dlužníka, podrobnosti o nemovitosti. předem připravená hypotéka.us.1004
1005 Ověření zaměstnanosti Extrahovat půjčku, dlužníka, podrobnosti o nemovitosti. předem připravená hypotéka.us.1005
Souhrnný dokument 1008 Extrahujte dlužníka, prodejce, nemovitosti, hypotéku a podrobnosti o přepsání. předem připravená hypotéka.us.1008
Závěrečné zveřejnění Extrahujte podrobnosti o závěrce, nákladech na transakce a půjčkách. prebuilt-mortgage.us.closingDisclosure

Ukázkový dokument o zavření vyzrazení zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovým zveřejněním závěru

Smlouva

Model kontraktu analyzuje a extrahuje klíčová pole a řádkové položky ze smluvních smluv, včetně stran, jurisdikcí, ID smlouvy a názvu. Model aktuálně podporuje dokumenty kontraktů v angličtině.

Ukázkový kontrakt zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky extrakce modelu kontraktu pomocí nástroje Document Intelligence Studio

Bankovní kontrola USA

Model kontraktu analyzuje a extrahuje klíčová pole z kontroly, včetně podrobností o kontrole, podrobností o účtu, částky, memo, se extrahuje z bankovních kontrol USA.

Ukázková bankovní kontrola zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s extrakcí modelu kontroly bank pomocí nástroje Document Intelligence Studio

Bankovní výpis USA

Model bankovního výpisu analyzuje a extrahuje klíčová pole a řádkové položky z čísla účtu bankovního výpisu v USA, podrobnosti o bankovním výpisu, podrobnosti výpisu a podrobnosti transakce.

Ukázkový bankovní výpis zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s extrakcí modelu bankovního výpisu pomocí nástroje Document Intelligence Studio

PayStub

Model paystub analyzuje a extrahuje klíčová pole a řádkové položky z dokumentů a souborů s informacemi souvisejícími s mzdami.

Ukázková procedura paystub zpracovávaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky extrakce modelu s zástupnými procedurou pomocí nástroje Document Intelligence Studio

Faktura

Model faktury automatizuje zpracování faktur a extrahuje jméno zákazníka, fakturační adresu, termín splatnosti a splatnou částku, řádkové položky a další klíčová data.

Ukázková faktura zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovou fakturou

Potvrzení

Pomocí modelu účtenek můžete zkontrolovat prodejní účtenky pro obchodní jméno, kalendářní data, řádkové položky, množství a součty z tištěných a ručně psaných účtenek. Verze v3.0 také podporuje jednostránkové zpracování potvrzení o hotelech.

Ukázkový příjem zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovým účtem

Dokument identity (ID)

Pomocí modelu dokument identity (ID) můžete zpracovat licence řidiče USA (všech 50 států a okresu Columbia) a životopisné stránky z mezinárodních pasů (s výjimkou víza a dalších cestovních dokumentů) k extrakci klíčových polí.

Ukázková licence řidiče v USA zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovou identifikační kartou

Manželství certifikátu

Pomocí modelu certifikátu manželství můžete zpracovávat certifikáty manželství v USA k extrakci klíčových polí včetně jednotlivců, data a umístění.

Ukázkový certifikát manželství v USA zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovým certifikátem manželství

Platební karta

Pomocí modelu kreditní karty můžete zpracovávat kreditní a debetní karty k extrakci polí klíče.

Ukázková platební karta zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovou platební kartou

Vlastní modely

Vlastní modely lze široce klasifikovat do dvou typů. Vlastní klasifikační modely, které podporují klasifikaci typu dokumentu a vlastní modely extrakce, které můžou extrahovat definované schéma z konkrétního typu dokumentu.

Diagram typů vlastních modelů a přidružených režimů sestavení modelu

Vlastní modely dokumentů analyzují a extrahují data z formulářů a dokumentů specifických pro vaši firmu. Rozpoznávají pole formulářů v rámci vašeho jedinečného obsahu a extrahují páry klíč-hodnota a data tabulky. Abyste mohli začít, potřebujete jenom jeden příklad typu formuláře.

Vlastní modely verze 3.0 a novější podporují detekci podpisů ve vlastní šabloně (formuláři) a křížových tabulkách v šablonách i v neurálních modelech. Detekce podpisu hledá přítomnost podpisu, nikoli identitu osoby, která dokument podepíše. Pokud model vrátí nepodepsaný podpis pro detekci podpisu, v definovaném poli nebyl nalezen podpis.

Ukázková vlastní šablona zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky nástroje Document Intelligence s možností analyzovat okno vlastního formuláře

Vlastní extrakce

Vlastní model extrakce může být jeden ze tří typů, vlastní šablona, vlastní neurální. Pokud chcete vytvořit vlastní model extrakce, označte datovou sadu dokumentů hodnotami, které chcete extrahovat, a vytrénujte model na označené datové sadě. Abyste mohli začít, potřebujete jenom pět příkladů stejného formuláře nebo typu dokumentu.

Ukázková vlastní extrakce zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s analýzou vlastního modelu extrakce v nástroji Document Intelligence Studio

Vlastní klasifikátor

Vlastní klasifikační model umožňuje identifikovat typ dokumentu před vyvoláním modelu extrakce. Klasifikační model je k dispozici od 2023-07-31 (GA) rozhraní API. Trénování vlastního klasifikačního modelu vyžaduje alespoň dvě odlišné třídy a minimálně pět vzorků na třídu.

Složené modely

Složený model se vytvoří tak, že vezme kolekci vlastních modelů a přiřadí je k jednomu modelu vytvořenému z vašich typů formulářů. Můžete přiřadit více vlastních modelů složeným modelům volaným s jedním ID modelu. K jednomu složeného modelu můžete přiřadit až 200 trénovaných vlastních modelů.

Okno dialogového okna Složený model v nástroji Document Intelligence Studio:

Snímek obrazovky s dialogovým oknem pro vytvoření vlastního modelu v sadě Document Intelligence Studio

Požadavky na vstup

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Čteno
    Rozložení
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace
  • Nejlepšíchvýsledkůch

  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

Poznámka:

Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.

Migrace verzí

Naučte se ve svých aplikacích používat Document Intelligence v3.0 podle našeho průvodce migrací Document Intelligence v3.1.

Model Popis
Analýza dokumentů
Rozložení Extrahujte informace o textu a rozložení z dokumentů.
Předem připravené
Faktura Extrahujte klíčové informace z anglické a španělské faktury.
Paragon Extrahujte klíčové informace z anglických účtenek.
Průkaz totožnosti Extrahujte klíčové informace z licencí na řidiče USA a mezinárodních pasů.
Vizitka Extrahujte klíčové informace z anglických vizitek.
Vlastní
Vlastní Extrahujte data z formulářů a dokumentů specifických pro vaši firmu. Vlastní modely se trénují pro různá data a případy použití.
Klidný Vytvořte kolekci vlastních modelů a přiřaďte je k jednomu modelu vytvořenému z typů formulářů.

Rozložení

Rozhraní API rozložení analyzuje a extrahuje text, tabulky a záhlaví, značky výběru a informace o struktuře z dokumentů.

Ukázkový dokument zpracovaný pomocí nástroje Ukázkové popisky:

Snímek obrazovky s analýzou rozložení pomocí nástroje Sample Labeling

Faktura

Model faktury analyzuje a extrahuje klíčové informace z prodejních faktur. Rozhraní API analyzuje faktury v různých formátech a extrahuje klíčové informace, jako je jméno zákazníka, fakturační adresa, termín splatnosti a splatná částka.

Ukázková faktura zpracovaná pomocí nástroje Ukázkový popisek:

Snímek obrazovky s ukázkovou analýzou faktury pomocí nástroje Sample Labeling

Potvrzení

  • Model účtenek analyzuje a extrahuje klíčové informace z tištěných a rukou psaných prodejních účtenek.

Ukázková účtenka zpracována pomocí nástroje Pro popisování vzorku:

Snímek obrazovky s ukázkovým účtem

Průkaz totožnosti

Model dokumentu ID analyzuje a extrahuje klíčové informace z následujících dokumentů:

  • Licence řidiče USA (všech 50 států a District of Columbia)

  • Životopisné stránky z mezinárodních pasů (s výjimkou víza a dalších cestovních dokladů). Rozhraní API analyzuje dokumenty identit a extrahuje.

Ukázková uživatelská licence řidiče zpracovaná pomocí nástroje Ukázkové popisování:

Snímek obrazovky s ukázkovou identifikační kartou

Vizitka

Model vizitek analyzuje a extrahuje klíčové informace z obrázků vizitek.

Ukázková vizitka zpracovaná pomocí nástroje Ukázkový popisek:

Snímek obrazovky s ukázkovou vizitkou

Vlastní

  • Vlastní modely analyzují a extrahují data z formulářů a dokumentů specifických pro vaši firmu. Rozhraní API je program strojového učení natrénovaný tak, aby rozpoznal pole formulářů v rámci vašeho jedinečného obsahu a extrahoval páry klíč-hodnota a data tabulek. Abyste mohli začít, potřebujete jenom pět příkladů stejného typu formuláře a vlastní model můžete trénovat pomocí datových sad označených nebo bez popisků.

Ukázkové vlastní zpracování modelu pomocí nástroje Sample Labeling:

Snímek obrazovky nástroje Document Intelligence s možností analyzovat okno vlastního formuláře

Složený vlastní model

Složený model se vytvoří tak, že vezme kolekci vlastních modelů a přiřadí je k jednomu modelu vytvořenému z vašich typů formulářů. Můžete přiřadit více vlastních modelů složeným modelům volaným s jedním ID modelu. K jednomu složenému modelu je možné přiřadit až 100 natrénovaných vlastních modelů.

Okno dialogového okna Složený model pomocí nástroje Ukázkové popisky:

Snímek obrazovky s dialogovým oknem pro vytvoření vlastního modelu v sadě Document Intelligence Studio

Extrakce dat modelu

Model Extrakce textu Detekce jazyka Značky výběru Tabulky Odstavce Role odstavce Páry klíč-hodnota Pole
Rozložení
Faktura
Paragon
Dokument ID
Vizitka
Vlastní formulář

Požadavky na vstup

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Čteno
    Rozložení
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace
  • Nejlepšíchvýsledkůch

  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

Poznámka:

Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.

Migrace verzí

Informace o používání funkce Document Intelligence v3.0 ve vašich aplikacích najdete v našem průvodci migrací Document Intelligence v3.1.

Další kroky

  • Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.

  • Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.