Použití obecných modelů dokumentu, čtení a rozložení

Dokončeno

Pokud chcete extrahovat text, jazyky a další informace z dokumentů s nepředvídatelnými strukturami, můžete použít modely čtení, obecného dokumentu nebo rozložení.

V dotazovací společnosti často zákazníci a partneři posílají specifikace, nabídky, prohlášení o práci a další dokumenty s nepředvídatelnými strukturami. Chcete vědět, jestli Azure AI Document Intelligence dokáže analyzovat a extrahovat hodnoty z těchto dokumentů.

Tady se dozvíte o předem připravených modelech, které Microsoft poskytuje pro obecné dokumenty.

Použití modelu pro čtení

Model čtení funkce Document Intelligence v Azure AI extrahuje tištěný a ručně psaný text z dokumentů a obrázků. Slouží k poskytování extrakce textu ve všech ostatních předem připravených modelech.

Model pro čtení dokáže také rozpoznat jazyk, ve kterém je řádek textu napsaný, a klasifikovat, jestli se jedná o rukou psaný nebo tištěný text.

Poznámka:

Model pro čtení podporuje více jazyků pro tištěný text než rukou psaný text. Aktuální seznam podporovaných jazyků najdete v dokumentaci.

U vícestránkových souborů PDF nebo TIFF můžete pomocí parametru pages v požadavku opravit rozsah stránek pro analýzu.

Model pro čtení je ideální, pokud chcete extrahovat slova a čáry z dokumentů bez pevné nebo předvídatelné struktury.

Použití obecného modelu dokumentu

Obecný model dokumentu rozšiřuje funkce modelu čtení přidáním detekce párů klíč-hodnota, entit, výběrových značek a tabulek. Model může tyto hodnoty extrahovat ze strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů.

Obecný model dokumentu je jediný předem vytvořený model pro podporu extrakce entit. Dokáže rozpoznat entity, jako jsou lidé, organizace a kalendářní data, a spouští se proti celému dokumentu, nejen párům klíč-hodnota. Tento přístup zajišťuje, že když strukturální složitost znemožní modelu extrahování páru klíč-hodnota, je možné entitu extrahovat. Mějte ale na paměti, že někdy může jeden text vrátit dvojici klíč-hodnota i entitu.

Mezi typy entit, které můžete rozpoznat, patří:

  • Person. Jméno osoby.
  • PersonType. Pracovní pozice nebo role.
  • Location. Budovy, geografické vlastnosti, geopolitické entity.
  • Organization. Společnosti, vládní instituce, sportovní kluby, hudební kapely a další skupiny.
  • Event. Společenské setkání, historické události, výročí.
  • Product. Objekty koupily a prodaly.
  • Skill. Schopnost patřící osobě.
  • Address. Poštovní adresa pro fyzické umístění
  • Phone number. Vytáčení kódů a čísel pro mobilní telefony a pevné linky
  • Email. E-mailové adresy
  • URL. Adresy webových stránek.
  • IP Address. Síťové adresy pro hardware počítače.
  • DateTime. Kalendářní data a časy dne
  • Quantity. Číselná měření s jejich jednotkami.

Použití modelu rozložení

Kromě extrakce textu model rozložení vrátí značky výběru a tabulky ze vstupního obrázku nebo souboru PDF. Je to dobrý model, který můžete použít, když potřebujete bohaté informace o struktuře dokumentu.

Při digitalizaci dokumentu může být v odlišném úhlu. Tabulky můžou mít složité struktury se záhlavími nebo bez záhlaví, buněk, které pokrývají sloupce nebo řádky, a neúplné sloupce nebo řádky. Model rozložení dokáže zvládnout všechny tyto potíže s extrahováním kompletní struktury dokumentu.

Každá buňka tabulky se například extrahuje takto:

  • Jeho text obsahu.
  • Velikost a umístění ohraničujícího rámečku.
  • Pokud je součástí sloupce záhlaví.
  • Indexy označující umístění řádku a sloupce v tabulce.

Značky výběru se extrahují pomocí ohraničujícího rámečku, indikátoru spolehlivosti a toho, jestli jsou vybrané nebo ne.

Další informace