Modely hypoték Document Intelligence

Článek
12/12/2024

Tento obsah se vztahuje na: v4.0 (GA)

Modely hypoték Document Intelligence používají výkonné funkce optického rozpoznávání znaků (OCR) a modely hlubokého učení k analýze a extrakci klíčových polí z hypoték. Hypotéky mohou být různé formáty a kvalita. Rozhraní API analyzuje dokumenty hypotéky a vrací strukturovanou reprezentaci dat JSON. Modely aktuálně podporují pouze dokumenty anglického jazyka. S nejnovější verzí V4.0 teď můžete extrahovat podpisy z hypoték a formulářů.

Podporované typy dokumentů:

Jednotné žádosti o půjčku na bydlení (formulář 1003)
Uniform Residential Appraisal Report (formulář 1004)
Ověření formuláře zaměstnání (formulář 1005)
Jednotný přepis a přenosový souhrn (formulář 1008)
Formulář pro uzavření zpřístupnění

Možnosti vývoje

Document Intelligence v4.0 (2024-11-30-GA) podporuje následující nástroje, aplikace a knihovny:

Funkce	Zdroje informací	ID modelu
Model hypotéky	• Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK	• předem připravená hypotéka.us.1003 • předem připravená hypotéka.us.1004 • předem připravená hypotéka.us.1005 • předem připravená hypotéka.us.1008 • předem připravená-hypotéka.us.closingDisclosure

Požadavky na vstup

Podporované formáty souborů:

Model	PDF	Obrázek: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	systém Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Čteno	✔	✔	✔
Rozložení	✔	✔	✔
Obecný dokument	✔	✔
Předpřipravený	✔	✔
Vlastní extrakce	✔	✔
Vlastní klasifikace	✔	✔	✔

Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).
Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).
Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
- Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.
- Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

Vyzkoušení extrakce údajů o hypotékách

Pokud chcete zjistit, jak extrakce dat funguje pro službu hypoték, potřebujete následující zdroje informací:

Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Document Intelligence Studio

Na domovské stránce Aplikace Document Intelligence Studio vyberte Možnost Hypotéka.
Můžete analyzovat ukázkové dokumenty hypotéky nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

Vyzkoušení nástroje Document Intelligence Studio

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .

Extrakce polí

Podporovaná pole pro extrakci dokumentů najdete na stránkách schématu modelu hypotéky v našem ukázkovém úložišti GitHubu.

Další kroky

Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.

Sdílet prostřednictvím