Použití obecných modelů dokumentu, čtení a rozložení
Pokud chcete extrahovat text, jazyky a další informace z dokumentů s nepředvídatelnými strukturami, můžete použít modely čtení, obecného dokumentu nebo rozložení.
V dotazovací společnosti často zákazníci a partneři posílají specifikace, nabídky, prohlášení o práci a další dokumenty s nepředvídatelnými strukturami. Chcete vědět, jestli Azure AI Document Intelligence dokáže analyzovat a extrahovat hodnoty z těchto dokumentů.
Tady se dozvíte o předem připravených modelech, které Microsoft poskytuje pro obecné dokumenty.
Použití modelu pro čtení
Model čtení funkce Document Intelligence v Azure AI extrahuje tištěný a ručně psaný text z dokumentů a obrázků. Slouží k poskytování extrakce textu ve všech ostatních předem připravených modelech.
Model pro čtení dokáže také rozpoznat jazyk, ve kterém je řádek textu napsaný, a klasifikovat, jestli se jedná o rukou psaný nebo tištěný text.
Poznámka:
Model pro čtení podporuje více jazyků pro tištěný text než rukou psaný text. Aktuální seznam podporovaných jazyků najdete v dokumentaci.
U vícestránkových souborů PDF nebo TIFF můžete pomocí parametru pages
v požadavku opravit rozsah stránek pro analýzu.
Model pro čtení je ideální, pokud chcete extrahovat slova a čáry z dokumentů bez pevné nebo předvídatelné struktury.
Použití obecného modelu dokumentu
Obecný model dokumentu rozšiřuje funkce modelu čtení přidáním detekce párů klíč-hodnota, entit, výběrových značek a tabulek. Model může tyto hodnoty extrahovat ze strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů.
Obecný model dokumentu je jediný předem vytvořený model pro podporu extrakce entit. Dokáže rozpoznat entity, jako jsou lidé, organizace a kalendářní data, a spouští se proti celému dokumentu, nejen párům klíč-hodnota. Tento přístup zajišťuje, že když strukturální složitost znemožní modelu extrahování páru klíč-hodnota, je možné entitu extrahovat. Mějte ale na paměti, že někdy může jeden text vrátit dvojici klíč-hodnota i entitu.
Mezi typy entit, které můžete rozpoznat, patří:
Person
. Jméno osoby.PersonType
. Pracovní pozice nebo role.Location
. Budovy, geografické vlastnosti, geopolitické entity.Organization
. Společnosti, vládní instituce, sportovní kluby, hudební kapely a další skupiny.Event
. Společenské setkání, historické události, výročí.Product
. Objekty koupily a prodaly.Skill
. Schopnost patřící osobě.Address
. Poštovní adresa pro fyzické umístěníPhone number
. Vytáčení kódů a čísel pro mobilní telefony a pevné linkyEmail
. E-mailové adresyURL
. Adresy webových stránek.IP Address
. Síťové adresy pro hardware počítače.DateTime
. Kalendářní data a časy dneQuantity
. Číselná měření s jejich jednotkami.
Použití modelu rozložení
Kromě extrakce textu model rozložení vrátí značky výběru a tabulky ze vstupního obrázku nebo souboru PDF. Je to dobrý model, který můžete použít, když potřebujete bohaté informace o struktuře dokumentu.
Při digitalizaci dokumentu může být v odlišném úhlu. Tabulky můžou mít složité struktury se záhlavími nebo bez záhlaví, buněk, které pokrývají sloupce nebo řádky, a neúplné sloupce nebo řádky. Model rozložení dokáže zvládnout všechny tyto potíže s extrahováním kompletní struktury dokumentu.
Každá buňka tabulky se například extrahuje takto:
- Jeho text obsahu.
- Velikost a umístění ohraničujícího rámečku.
- Pokud je součástí sloupce záhlaví.
- Indexy označující umístění řádku a sloupce v tabulce.
Značky výběru se extrahují pomocí ohraničujícího rámečku, indikátoru spolehlivosti a toho, jestli jsou vybrané nebo ne.
Další informace
- Podpora jazyků pro Azure AI Document Intelligence
- Model čtení v Azure AI Document Intelligence
- Obecný model dokumentů Azure AI Document Intelligence
- Model rozložení Analýzy dokumentů Azure AI