Který model mám zvolit?
Azure AI Document Intelligence podporuje širokou škálu modelů, které umožňují přidat inteligentní zpracování dokumentů do aplikací a optimalizovat pracovní postupy. Výběr správného modelu je nezbytný k zajištění úspěchu vašeho podniku. V tomto článku prozkoumáme dostupné modely Document Intelligence a poskytneme pokyny, jak zvolit nejlepší řešení pro vaše projekty.
Následující rozhodovací grafy zvýrazňují funkce jednotlivých podporovaných modelů, které vám pomůžou vybrat model, který nejlépe vyhovuje potřebám a požadavkům vaší aplikace.
Důležité
Nezapomeňte zkontrolovat stránku podpory jazyka pro podporovaný text jazyka a extrakci polí podle funkce.
Předem natrénované modely analýzy dokumentů
Typ dokumentu | Příklad | Data, která se mají extrahovat | Vaše nejlepší řešení |
---|---|---|---|
Obecný dokument. | Smlouva nebo dopis. | Chcete primárně extrahovat psané nebo tištěné textové řádky, slova, umístění a zjištěné jazyky. | Čtení modelu OCR |
Dokument, který obsahuje strukturální informace. | Zpráva nebo studie. | Kromě psaného nebo tištěného textu je potřeba extrahovat strukturální informace, jako jsou tabulky, značky výběru, odstavce, názvy, nadpisy a podnadpisy. | Model analýzy rozložení |
Strukturovaný nebo částečně strukturovaný dokument, který obsahuje obsah formátovaný jako pole (klíče) a hodnoty. | Formulář nebo dokument, který je standardizovaný formát běžně používaný ve vaší firmě nebo odvětví, jako je úvěrová aplikace nebo průzkum. | Chcete extrahovat pole a hodnoty, včetně těch, které nejsou pokryty předem vytvořenými modely specifickými pro scénář, aniž byste museli trénovat vlastní model. | **Model analýzy rozložení s povoleným volitelným parametrem features=keyValuePairs řetězce dotazu ** |
Předem natrénované modely specifické pro scénáře
Typ dokumentu | Data, která se mají extrahovat | Vaše nejlepší řešení |
---|---|---|
Sjednocená daň USA | Chcete extrahovat klíčové informace ze všech daňových formulářů W2, 1040, 1090, 1098 z jednoho souboru bez spuštění vlastní klasifikace. | Jednotný daňový model USA |
Daň z DANĚ Z USA W-2 | Chcete extrahovat klíčové informace, jako jsou mzdy, mzdy a daně sdružené. | Daňový model W-2 v USA |
Daň z DANĚ Z USA W-4 | Chcete extrahovat klíčové informace, jako jsou úpravy deklarací identity, osobní údaje. | Daňový model W-4 v USA |
US Tax 1095(A;C) | Chcete extrahovat prémiový daňový kredit, podrobnosti o platbě předem. | Model us tax 1095 |
US Tax 1098 | Chcete extrahovat podrobnosti o hypotékách, jako jsou jistina, body a daň. | Model us tax 1098 |
US Tax 1098-E | Chcete extrahovat podrobnosti o úrokech studentů, jako je věřitel a částka úroku. | Americký daňový model 1098-E |
US Tax 1098T | Chcete extrahovat podrobnosti o kvalifikované výuce, jako jsou úpravy stipendia, stav studenta a informace o věřiteli. | Americký daňový model 1098-T |
US Tax 1099(Varianty) | Chcete extrahovat informace z 1099 formulářů a jejich variant (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Model us tax 1099 |
US Tax 1040(Varianty) | Chcete extrahovat informace z 1040 formulářů a jejich variant (Plán 1, Plán 2, Plán 3, Plán 8812, Plán A, Plán B, Plán C, Plán D, Plán E, Plán EIC F, Plán H, Plán J, Plán R, Plán 1, Plán 1, Plán 1, Plán 1, Plán 1 SE , Plán 1, Plán 1, Plán 1, Plán 1, Plán 1. plán). |
Model daně z USA 1040 |
Bankovní výpis | Chcete extrahovat klíčové informace z bankovního výpisu v USA | \Bankovní výpis |
Bankovní šek | Chcete extrahovat informace o klíči z kontrolního dokumentu. | Bankovní šek |
Smlouva (právní dohoda mezi stranami). | Chcete extrahovat podrobnosti smlouvy, jako jsou strany, data a intervaly. | Model kontraktů |
Zdravotní pojištění nebo ID zdravotního pojištění. | Chcete extrahovat klíčové informace, jako je pojištění, ID člena, pokrytí předpisem a číslo skupiny. | Model zdravotní karty |
Kreditní/debetní karta | Chcete extrahovat klíčové informace bankovní karty, jako je číslo karty a název banky. | Model kreditní/debetní karty |
Manželství certifikátu | Chcete extrahovat klíčové informace z manželství certifikátů. | Model certifikátu manželství |
Faktura nebo vyúčtování | Chcete extrahovat klíčové informace, jako je jméno zákazníka, fakturační adresa a splatná částka. | Model faktury |
Potvrzení, poukázka nebo jednostránkové potvrzení o hotelu. | Chcete extrahovat klíčové informace, jako je název obchodníka, datum transakce a celkový součet transakcí. | Model účtenek |
Doklad totožnosti (ID) jako řidičské průkazy usa nebo mezinárodní pas | Chcete extrahovat klíčové informace, jako je jméno, příjmení, datum narození, adresa a podpis. | Model dokumentu identity (ID) |
Zástupný způsob platby | Chcete extrahovat klíčové informace z dokumentu s zástupnými informacemi o platbách. | Model zástupných procedur pro platby |
Americká hypotéka 1003 | Chcete extrahovat klíčové informace z žádosti o půjčku Uniform Residential. | Model formuláře 1003 |
Americký hypotéka 1004 | Chcete extrahovat klíčové informace z Uniform Residential Appraisal Report (URAR). | Model formuláře 1004 |
Americká hypotéka 1005 | Chcete extrahovat klíčové informace z formuláře Ověření zaměstnání | Model formuláře 1005 |
Americká hypotéka 1008 | Chcete extrahovat klíčové informace ze souhrnu jednotných přepisů a přenosů. | Model formuláře 1008 |
Americké hypotéky závěrečné zveřejnění | Chcete extrahovat klíčové informace z formuláře pro uzavření hypotéky. | Model zpřístupnění hypotéky |
Dokumenty se smíšeným typem se strukturovanými, částečně strukturovanými a/nebo nestrukturovanými prvky | Chcete extrahovat páry klíč-hodnota, značky výběru, tabulky, pole podpisu a vybrané oblasti, které nejsou extrahovány předem vytvořenými nebo obecnými modely dokumentů. | Vlastní model |
Tip
- Pokud si stále nejste jistí, který předem natrénovaný model použít, zkuste model rozložení s povoleným volitelným parametrem
features=keyValuePairs
řetězce dotazu. - Model rozložení využívá modul Read OCR ke zjišťování stránek, tabulek, stylů, textu, řádků, slov, umístění a jazyků.
Vlastní modely extrakce
Trénovací sada | Ukázkové dokumenty | Vaše nejlepší řešení |
---|---|---|
Strukturované, konzistentní dokumenty se statickým rozložením | Strukturované formuláře, jako jsou dotazníky nebo aplikace. | Vlastní model šablony |
Strukturovaná a částečně strukturovaná. | ● Strukturované → průzkumy ● Částečně strukturované → faktury |
Vlastní neurální model |
Kolekce několika modelů, které jsou vytrénované na dokumentech podobného typu. | ● Nákupní objednávky zařízení● Nákupní objednávky nábytku Všechny složené do jednoho modelu. |
Složený vlastní model |
Vlastní klasifikační model
Trénovací sada | Ukázkové dokumenty | Vaše nejlepší řešení |
---|---|---|
Aspoň dva různé typy dokumentů. | Formuláře, dopisy nebo dokumenty | Vlastní klasifikační model |