Model vizitek Document Intelligence
Důležité
Počínaje funkcí Document Intelligence v4.0 a v budoucnu je model vizitek (předem vytvořený-businessCard) zastaralý. Pokud chcete extrahovat data z formátů vizitek, použijte následující:
Funkce | version | ID modelu |
---|---|---|
Model vizitek | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-businessCard |
[! INCLUDE [platí pro verzi 2.1].. /(includes/applies-to-v21.md)]
Model vizitek Document Intelligence kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hloubkového učení, které analyzují a extrahují data z obrázků vizitek. Rozhraní API analyzuje vytištěné vizitky; extrahuje klíčové informace, jako je jméno, příjmení, název společnosti, e-mailová adresa a telefonní číslo; a vrátí strukturovanou reprezentaci dat JSON.
Extrakce dat vizitek
Vizitky představují skvělý způsob, jak reprezentovat firmu nebo profesionála. Firemní logo, písma a obrázky na pozadí, které najdete na vizitkách, pomáhají propagovat firemní branding a odlišit ho od ostatních. Použití technik založených na technologii OCR a strojového učení pro automatizaci skenování vizitek je běžným scénářem zpracování obrázků. Podnikové systémy používané prodejními a marketingovými týmy mají obvykle integraci funkcí extrakce dat vizitek, aby mohli využívat výhody uživatelů.
Ukázková vizitka zpracovaná pomocí nástroje Document Intelligence Studio
Ukázka obchodního zpracování pomocí nástroje Document Intelligence Sample Labeling
Možnosti vývoje
Funkce Document Intelligence v3.1:2023-07-31 (GA) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model vizitek | • Document Intelligence Studio • REST API • Sada SDK jazyka C# • Python SDK • Java SDK • JavaScript SDK |
předem připravená vizitka |
Funkce Document Intelligence v3.0:2022-08-31 (GA) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model vizitek | • Document Intelligence Studio • REST API • Sada SDK jazyka C# • Python SDK • Java SDK • JavaScript SDK |
předem připravená vizitka |
Funkce Document Intelligence v2.1 (GA) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací |
---|---|
Model vizitek | • Nástroj pro popisování funkce Document Intelligence • REST API • Sada SDK klientské knihovny • Kontejner Dockeru Document Intelligence |
Vyzkoušení extrakce dat vizitek
Podívejte se, jak se data extrahují z vizitek, včetně jména, pracovní pozice, adresy, e-mailu a názvu společnosti. Potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Document Intelligence Studio
Poznámka:
Document Intelligence Studio je k dispozici s rozhraními API v3.1 a v3.0.
Na domovské stránce nástroje Document Intelligence Studio vyberte Vizitky.
Ukázkovou vizitku můžete analyzovat nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Nástroj Document Intelligence Sample Labeling
Přejděte k nástroji Ukázka funkce Document Intelligence.
Na domovské stránce ukázkového nástroje vyberte k získání dlaždice s daty předem vytvořený model.
V rozevírací nabídce vyberte typ formuláře, který chcete analyzovat.
Vyberte adresu URL souboru, který chcete analyzovat, z následujících možností:
- Ukázkový dokument faktury
- Ukázkový dokument s ID
- Ukázkový obrázek potvrzení
- Ukázkový obrázek vizitky
V poli Zdroj vyberte adresu URL z rozevírací nabídky, vložte vybranou adresu URL a vyberte tlačítko Načíst.
Do pole koncový bod služby Document Intelligence vložte koncový bod, který jste získali s předplatným Document Intelligence.
Do pole s klíčem vložte klíč, který jste získali z prostředku Document Intelligence.
Vyberte Spustit analýzu. Nástroj Popisování ukázek funkce Document Intelligence volá předem připravené rozhraní API pro analýzu a analyzuje dokument.
Prohlédněte si výsledky – prohlédněte si páry klíč-hodnota extrahované, řádkové položky, zvýrazněný text extrahovaný a zjištěné tabulky.
Poznámka:
Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.
Požadavky na vstup
Podporované formáty souborů:
Model PDF Obrázek: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
systém Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a
4
MB pro bezplatnou úroveň (F0).Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
bodě textu na 150 bodů na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a
1
GB pro neurální model.Pro trénování modelu vlastní klasifikace je
1
celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro 30.11.2024 (GA) je2
celková velikost trénovacích dat GB s maximálně 10 000 stránkami.
- Podporované formáty souborů: JPEG, PNG, PDF a TIFF
- SOUBORY PDF a TIFF se zpracovávají až na 2 000 stránek. Pro předplatitele úrovně Free se zpracovávají pouze první dvě stránky.
- Velikost souboru musí být menší než 50 MB a rozměry nejméně 50 × 50 pixelů a maximálně 10 000 × 10 000 pixelů.
Podporované jazyky a národní prostředí
Úplný seznam podporovaných jazyků najdete na naší stránce podpory předem připravených jazyků modelu.
Extrakce polí
Podporovaná pole pro extrakci dokumentů najdete na stránce schématu modelu vizitek v našem ukázkovém úložišti GitHubu.
Extrahovaná pole
Name | Typ | Popis | Text |
---|---|---|---|
ContactNames | pole objektů | Jméno kontaktu extrahované z vizitky | [{ "Jméno": "John", "LastName": "Doe" }] |
FirstName | string | Jméno (zadané) jméno kontaktu | "John" |
LastName | string | Příjmení (rodina) jméno kontaktu | "Doe" |
CompanyNames | pole řetězců | Název společnosti extrahovaný z vizitky | ["Contoso"] |
Oddělení | pole řetězců | Oddělení nebo organizace kontaktu | ["R&D"] |
JobTitles | pole řetězců | Uvedená pracovní pozice kontaktu | ["Softwarový inženýr"] |
E-maily | pole řetězců | Kontaktní e-mail extrahovaný z vizitky | [""johndoe@contoso.com] |
Weby | pole řetězců | Web extrahovaný z vizitky | [";https://www.contoso.com"] |
Adresy | pole řetězců | Adresa extrahovaná z vizitky | ["123 Main Street, Redmond, Washington 98052"] |
MobilePhones | pole telefonních čísel | Mobilní telefonní číslo extrahované z vizitky | ["+19876543210"] |
Faxy | pole telefonních čísel | Faxové telefonní číslo extrahované z vizitky | ["+19876543211"] |
Pracovní telefony | pole telefonních čísel | Pracovní telefonní číslo extrahované z vizitky | ["+19876543231"] |
Další telefony | pole telefonních čísel | Jiné telefonní číslo extrahované z vizitky | ["+19876543233"] |
Podporovaná národní prostředí
Předem připravené vizitky verze 2.1 podporují následující národní prostředí:
- en-us
- en-au
- en-ca
- en-gb
- En-in
Průvodce migrací a rozhraní REST API verze 3.1
- Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.0 ve vašich aplikacích a pracovních postupech.
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty .
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.
Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.